将html实体转换为等效字符串

时间:2015-09-11 12:01:26

标签: java

需要将html实体转换为等效字符串 - 我使用过StringEscapeUtils.unescapeHtml - 但它不适用于某些html代码,如&#539 - ţ。而StringEscapeUtils.unescapeHtml这适用于-é,ù。但是ţ正被转换为null

1 个答案:

答案 0 :(得分:0)

您可以尝试 StringEscapeUtils.unescapeHtml4

System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("é")); // é
System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("ù")); // ù
System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("ț")); // ț

另见:

<强> Character Entity Reference Chart