如何防止JSoup清理篡改内容

时间:2012-07-02 05:47:44

标签: jsoup

我需要JSoup从某些HTML字符串中删除脚本,并使用此代码段:

Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();

但它会在<br>代码之前插入额外的空格,将“和”转换为&quot;以及&apos;等,这是我不想要的。无法找到方法实现这一点。非常感谢JSoup所做的任何其他库的任何帮助或建议。

谢谢, 桑杰

1 个答案:

答案 0 :(得分:1)

尝试使用:

safeDoc.outputSettings().prettyPrint(false);

我遇到了同样的问题并修复了它。