Question

Document doc = Jsoup.parse(result);
ArrayList<String> elements = new ArrayList<String>();  
Elements e = doc.select("span");
for (int i = 0; i < e.size(); i++) {
elements.add(e.get(i).html());
}

上面的代码将此réhydraté中的法语字体解析为此réhydraté。我有问题在工具中打印这个。我打算使用replace()函数，但它不是正确的方法，因为有很多字体有相同的问题。我该如何解决这个问题？

Answer 1

它似乎正确解析它并使用HTML字符代码对其进行重新编码，这些代码在浏览器查看时会正确呈现。

根据您呈现输出的方式，可能不安全的方法是将Document.OutputSettings的Entities.EscapeMode更改为xhtml。

我建议您阅读输出工具上的文档，看看它支持哪种转义序列。

（通过“渲染输出”，我指的是用户最终如何查看输出。如果它将由浏览器查看HTML，则输出带有HTML实体，例如{{1将正确呈现为“é”。）

Jsoup - 法语字体解析编码值

1 个答案: