Document doc = Jsoup.parse(result);
ArrayList<String> elements = new ArrayList<String>();
Elements e = doc.select("span");
for (int i = 0; i < e.size(); i++) {
elements.add(e.get(i).html());
}
上面的代码将此réhydraté中的法语字体解析为此réhydraté
。我有问题在工具中打印这个。我打算使用replace()
函数,但它不是正确的方法,因为有很多字体有相同的问题。我该如何解决这个问题?
答案 0 :(得分:0)
它似乎正确解析它并使用HTML字符代码对其进行重新编码,这些代码在浏览器查看时会正确呈现。
根据您呈现输出的方式,可能不安全的方法是将Document.OutputSettings
的Entities.EscapeMode
更改为xhtml
。
我建议您阅读输出工具上的文档,看看它支持哪种转义序列。
(通过“渲染输出”,我指的是用户最终如何查看输出。如果它将由浏览器查看HTML,则输出带有HTML实体,例如{{1将正确呈现为“é”。)