JSoup根据标题选择基于Id和href的Div

时间:2012-01-18 15:19:53

标签: java parsing jsoup

我使用JSoup来解析HTML响应。我有多个Div标签。我必须根据ID选择Div标签。

我的伪代码看起来像这样,

Document divTag = Jsoup.connect(link).get();
Elements info = divTag.select("div#navDiv");

其中navDiv是ID。但它似乎没有用。

另外我想根据一些标题在Div中选择Href,其中hrefTitle []将是字符串数组。因此,在迭代href时,我会检查字符串数组中是否存在标题,如果是,我会将它们添加到列表中,否则忽略。如何在Div中选择href?以及如何选择标题?任何投入都非常赞赏。

1 个答案:

答案 0 :(得分:1)

  

但它似乎无法奏效。

应该工作。证明:

Document doc = Jsoup.parse("<html><body><div/>" + 
    "<div id=\"navDiv\">" + 
        "<a href=\"href1\">link1</a>" +
        "<a href=\"href2\">link2</a><" +
    "</div></body></html>");
Element div = doc.select("div#navDiv").first();

现在,我们可以选择a内的div元素,该元素包含(例如)href属性,其值为href2

System.out.println(div.select("a[href=href2]"));

输出:

<a href="href2">link2</a>

您可以在此处找到完整的选择器语法: