Question

我正在使用Jsoup API使用Jsoup.parse（）方法解析HTML的一部分。但是，在解析它时会将文档结构添加到HTML内容中。

例如：

<p><a href="some link">some link data</a> Some paragraph content</p>

变为

<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>

解析后我不想要文档结构（我不想要html，head，body标签）。有什么办法吗？提前谢谢。

解

我使用了Document的body（）和html（）方法

Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()

感谢您的建议。

Answer 1

您可以选择body-element的子项：

Document doc = Jsoup.parse("<p><a href=\"some link\">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();