解析html以检索没有Tag的数据

时间:2013-06-13 00:24:22

标签: java jsoup

我有这个html如下所示;我想使用JSOUP来检索TEXT 1 and TEXT 2

<html>
    <title>TITLE</title>
    <body>
         <h3>Subheading 1 </h3>
              TEXT 1
         <h3> Subheading 2</h3>
              TEXT 2
    </body>
</html>

我真的不知道如何调用它,因为它没有标签或id。请帮忙。

1 个答案:

答案 0 :(得分:0)

我从未使用过JSOUP,但是从简要的文档(JSOUP Documentation)开始,您应该可以使用标准的javascript方法进行导航,这样做

Document doc = Jsoup.connect("http://example.com/").get();
Elements headings = doc.getElementsByTag("h3");
for (Element heading : headings) {
   Element text=heading.nextElementSibling();
   String value=text.text();
}

那么价值应该有你想要的。请注意,这未经过测试,仅基于文档。