如何在java中将HTML转换为UTF-8

时间:2010-05-13 10:25:25

标签: java html utf-8

我有一个带有HTML实体的ASCII字符串,例如:

 à
 ¨
 ç

我需要这个String没有那些实体并将它们转换为UTF-8字符。 有没有简单的方法,在java中这样做?

其中:

 Clazz.method("aà","UTF-8")

返回“aà”

或类似的东西?

1 个答案:

答案 0 :(得分:16)

看看org.apache.commons.lang.StringEscapeUtils.unescapeHtml(...)。显然它理解HTML 4中定义的所有字符实体。