我有一个带有HTML实体的ASCII字符串,例如:
à
¨
ç
我需要这个String没有那些实体并将它们转换为UTF-8字符。 有没有简单的方法,在java中这样做?
其中:
Clazz.method("aà","UTF-8")
返回“aà”
或类似的东西?
答案 0 :(得分:16)
看看org.apache.commons.lang.StringEscapeUtils.unescapeHtml(...)。显然它理解HTML 4中定义的所有字符实体。