我们可以保留特定标记并从节点中删除其余标记。 喜欢
<li>my name is <a>this is link</a>
<li>again bullet</li>
</li>
在此我想删除嵌套的li标签并仅保留一个标签。
我如何使用jsoup /.
来做到这一点答案 0 :(得分:1)
选择要删除的标签,并要求Jsoup将其删除。
通过帖子中的示例,以下是如何翻译以下短语:
String html = "<li>my name is <a>this is link</a> <li>again bullet</li></li>";
Document doc = Jsoup.parse(html);
System.out.println("\nBEFORE:\n" + doc);
doc.select("li ~ li").remove();
System.out.println("\nAFTER:\n" + doc);
请注意,原始的html代码无效。这就是为什么Jsoup移出嵌套的li
标签。
BEFORE:
<html>
<head></head>
<body>
<li>my name is <a>this is link</a> </li>
<li>again bullet</li>
</body>
</html>
AFTER:
<html>
<head></head>
<body>
<li>my name is <a>this is link</a> </li>
</body>
</html>