Jsoup在文本节点中发出“实体”

时间:2013-07-11 03:54:24

标签: java jsoup

我正在使用Jsoup来清理来自TinyMCE控件的HTML。插入的HTML可能包含Velocity宏。 Jsoup将文本节点中的双引号编码为",这会破坏Velocity模板。例如,#if ($foo=="bar")正在更改为#if ($foo="bar"),Velocity认为这是一个错误。

TinyMCE本身仅通过编码属性值中的引号来避免此问题。文本节点中的引号不受干扰。

那么,有没有办法让Jsoup只在属性值中编码引号而不在文本节点中编码?

2 个答案:

答案 0 :(得分:0)

  

public boolean prettyPrint()

     

获取是否启用了漂亮打印。默认为true。如果禁用,则   HTML输出方法不会重新格式化输出,输出也会   通常看起来像输入。

要告诉JSoup不要重新格式化您的文档,您只需要包含

doc.outputSettings().prettyPrint(false);

JSoup API - Class Document.OutputSettings

答案 1 :(得分:0)

尝试使用Jsoup 1.8.1,它不再生成"