将HTML转义字符串转换为纯Unicode / ASCII

时间:2012-12-09 17:29:56

标签: java android html

  

可能重复:
  Java: How to decode HTML character entities in Java like HttpUtility.HtmlDecode?

是否有Java / Android方式将HTML转义字符串(例如Öß)转换回其ASCII / Unicode表示形式(例如Ö或{{1 }})?

我当然不希望做一个简单的字符串替换并尝试使用现有的每个HTML转义序列,我猜有一个现成的解决方案吗?

谢谢!

1 个答案:

答案 0 :(得分:9)

使用此:

import org.apache.commons.lang.StringEscapeUtils;

public class StringEscapeUtilsTrial {
public static void main(String[] args) {
    String strHTMLInput = "<p>MyName<p>";
    String strEscapeHTML = StringEscapeUtils.escapeHtml(strHTMLInput);
    String strUnEscapeHTML = StringEscapeUtils.unescapeHtml(strEscapeHTML);
    System.out.println("Escaped HTML >>> " + strEscapeHTML);
    System.out.println("UnEscaped HTML >>> " + strUnEscapeHTML);
    }
}