java清除html转义字符

这篇文章主要介绍了一个静态文件处理的一些便捷服务,包括 java清除html转义字符,清除html代码,从style样式中读取CSS的属性,将字符串截取指定长度,涉及log4j,common-lang类的学习

复制代码 代码如下:

import java.util.HashMap;
import java.util.Map;

import org.apache.commons.lang3.StringUtils;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
/**
 * 静态文件处理的一些便捷服务
 * @author Kettas
 * 4:27:25 PM
 */
public class HTMLServices {
 private static Log log=LogFactory.getLog(HTMLServices.class);

 /**
  * 清除html代码
  *

所有包括在'<'与'>'之间的内容全部都会被清除掉,并返回


  * @param args
  * @return String
  */
 public static String clearHTMLToString(String args){
  return clearHTMLToString(args,false);
 }
 /**
  * 清除html代码
  *

所有包括在'<'与'>'之间的内容全部都会被清除掉,并返回


  * @param args
  * @param replaceNull 是否替换空格等制表符
  * @return String
  */
 public static String clearHTMLToString(String args,boolean replaceNull){
  if(StringUtils.isEmpty(args)){
   return "";
  }
  args= args.replaceAll("(?is)<(.*?)>","");
  if(replaceNull){
   args = args.replaceAll("\\s*|\t|\r|\n","");
  }
  return args;
 }
 /**
  * 清除html代码
  *

所有包括在'<'与'>'之间的内容全部都会被清除掉,并指定返回的长度


  * @param args
  * @return String
  */
 public static String clearHTMLToString(String args,int maxSize){
  return clearHTMLToString(args, maxSize, "");
 }
 /**
  * 清除html代码
  *

所有包括在'<'与'>'之间的内容全部都会被清除掉,并指定返回的长度


  * @param args
  * @return String
  */
 public static String clearHTMLToString(String args,int maxSize,String replace){
  args=clearHTMLToString(args);
  if(maxSize<=0){
   return args;
  }
  if(args.length()<=maxSize){
   return args;
  }
  return args.substring(0,maxSize).concat(replace);
 }
 /**
  * 将字符串截取指定长度
  * @param args
  * @param maxSize
  * @param replace
  * @return String
  */
 public static String clearHTMLToSize(String args,int maxSize,String replace){
  if(args.length()<=maxSize){
   return args;
  }
  return args.substring(0,maxSize).concat(replace);
 }
// /**
//  * 从css样式文件中读取