如何获取所有超链接但忽略图像链接

时间:2013-02-19 02:10:20

标签: java css-selectors jsoup

我想用Jsoup获取网页的所有超链接。同时,我想忽略图像的所有超链接。是否可以为getElementsByTag添加更多限制?

Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");

1 个答案:

答案 0 :(得分:0)

如果您的图片使用asrc标签相关联 - 属性(普通链接使用href),请使用以下代码:

Document doc = Jsoup.connect(url).timeout(1000).get();
Elements links = doc.select("a[href]"); // Only select 'a'-tags with 'href' attribute

有关jsoup选择器api的信息,请参阅here