Jsoup - 法语字体解析编码值

时间:2014-02-26 03:25:44

标签: java html jsoup rtf

Document doc = Jsoup.parse(result);
ArrayList<String> elements = new ArrayList<String>();  
Elements e = doc.select("span");
for (int i = 0; i < e.size(); i++) {
elements.add(e.get(i).html());
}

上面的代码将此réhydraté中的法语字体解析为此r&eacute;hydrat&eacute;。我有问题在工具中打印这个。我打算使用replace()函数,但它不是正确的方法,因为有很多字体有相同的问题。我该如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

它似乎正确解析它并使用HTML字符代码对其进行重新编码,这些代码在浏览器查看时会正确呈现。

根据您呈现输出的方式,可能不安全的方法是将Document.OutputSettingsEntities.EscapeMode更改为xhtml

我建议您阅读输出工具上的文档,看看它支持哪种转义序列。

(通过“渲染输出”,我指的是用户最终如何查看输出。如果它将由浏览器查看HTML,则输出带有HTML实体,例如{{1将正确呈现为“é”。)