不希望在通过JSOUP解析时创建文档结构

时间:2014-05-07 05:28:47

标签: javascript html parsing java-ee jsoup

我正在使用Jsoup API使用Jsoup.parse()方法解析HTML的一部分。但是,在解析它时会将文档结构添加到HTML内容中。

例如:

<p><a href="some link">some link data</a> Some paragraph content</p>

变为

<html>
<head></head>
<body>
<p><a href="some link">some link data</a> Some paragraph content</p>
</body>
</html>

解析后我不想要文档结构(我不想要html,head,body标签)。有什么办法吗? 提前谢谢。

我使用了Document的body()和html()方法

Document storyBodyDoc;
storyBodyDoc = Jsoup.parse(body);
storyBodyDoc.body().html()

感谢您的建议。

1 个答案:

答案 0 :(得分:0)

您可以选择body-element的子项:

Document doc = Jsoup.parse("<p><a href=\"some link\">some link data</a> Some paragraph content</p>");
Elements content = doc.body().children();