我正在使用Jsoup API使用Jsoup.parse()方法解析HTML的一部分。但是,在解析它时会将文档结构添加到HTML内容中。
例如:
<p><a href="some link">some link data</a> Some paragraph content</p>
变为
<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>
解析后我不想要文档结构(我不想要html,head,body标签)。有什么办法吗? 提前谢谢。
解
我使用了Document的body()和html()方法
Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()
感谢您的建议。
答案 0 :(得分:0)
您可以选择body-element的子项:
Document doc = Jsoup.parse("<p><a href=\"some link\">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();