Java jsoup选择链接

时间:2016-04-12 13:28:24

标签: java html parsing jsoup

我正在尝试开发网络抓取工具,我可以从一个页面中提取所有链接,但我想得到一些特定的链接,我检查但是我无法管理它,因为我对HTML没有很好的知识

enter image description here

2 个答案:

答案 0 :(得分:1)

 Element divcontent = doc.select("div.content").first();
 Element ul = divcontent.select("ul.indepth-list").first();
 ul.select("a[href]");

没有编辑器编写,所以我不记得语法是否正确。

答案 1 :(得分:1)

您可以使用以下代码段中显示的CSS选择器:

doc.select("div.indepth-content > div.content > ul.indepth-list a")

在屏幕截图中,您似乎正在使用Chrome浏览器。如果是这样,下次您可以要求它为您生成CSS查询:

  1. 右键单击您定位的元素
  2. 点击“检查”(节点应该显示为选中
  3. 右键单击此节点,然后选择复制条目和复制选择器子条目
  4. => CSS选择器被复制到剪贴板

    请注意,Chrome会产生(非常)长的CSS查询。此外,它无法生成用于匹配多个元素的CSS选择器。

    但是,如果在打开DevTools窗格并选择了Elements选项卡时键入 CTRL + F ,则可以键入CSS选择器并浏览匹配的元素。 / p>

    有关详细信息,您可以查看以下资源: