如何使用jsoup删除标签但保留给定标签

时间:2018-07-31 12:07:28

标签: java html jsoup

如何使用jsoup删除<p><img>以外的所有标签?

<div>
  <p>hello world
    <span>good</span>
    <img src="/src/img/beauty.jpg"/>
    welcome
  </p>
</div>

应该成为

<p>hello world
    good
    <img src="/src/img/beauty.jpg"/>
    welcome
  </p>

1 个答案:

答案 0 :(得分:1)

您将要查看Cleaner.clean() method。您将指定一个Whitelist您要允许的标签。

Example from jsoup.org

String unsafe = 
    "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";
String safe = Jsoup.clean(unsafe, Whitelist.basic());
    // now: <p><a href="http://example.com/" rel="nofollow">Link</a></p>