我需要JSoup从某些HTML字符串中删除脚本,并使用此代码段:
Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();
但它会在<br>
代码之前插入额外的空格,将“和”转换为"
;以及'
等,这是我不想要的。无法找到方法实现这一点。非常感谢JSoup所做的任何其他库的任何帮助或建议。
谢谢, 桑杰
答案 0 :(得分:1)
尝试使用:
safeDoc.outputSettings().prettyPrint(false);
我遇到了同样的问题并修复了它。