需要将html实体转换为等效字符串 - 我使用过StringEscapeUtils.unescapeHtml
- 但它不适用于某些html代码,如&#539 - ţ。而StringEscapeUtils.unescapeHtml
这适用于-é,ù。但是ţ正被转换为null
。
答案 0 :(得分:0)
您可以尝试 StringEscapeUtils.unescapeHtml4
System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("é")); // é
System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("ù")); // ù
System.out.println(org.apache.commons.lang3.StringEscapeUtils.unescapeHtml4("ț")); // ț