我想用Jsoup获取网页的所有超链接。同时,我想忽略图像的所有超链接。是否可以为getElementsByTag添加更多限制?
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
答案 0 :(得分:0)
如果您的图片使用a
与src
标签相关联 - 属性(普通链接使用href
),请使用以下代码:
Document doc = Jsoup.connect(url).timeout(1000).get();
Elements links = doc.select("a[href]"); // Only select 'a'-tags with 'href' attribute
有关jsoup选择器api的信息,请参阅here。