如何使用jsoup删除<p>
和<img>
以外的所有标签?
<div>
<p>hello world
<span>good</span>
<img src="/src/img/beauty.jpg"/>
welcome
</p>
</div>
应该成为
<p>hello world
good
<img src="/src/img/beauty.jpg"/>
welcome
</p>
答案 0 :(得分:1)
您将要查看Cleaner.clean() method。您将指定一个Whitelist您要允许的标签。
String unsafe =
"<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";
String safe = Jsoup.clean(unsafe, Whitelist.basic());
// now: <p><a href="http://example.com/" rel="nofollow">Link</a></p>