我正在尝试抓取此网页:http://www.bbc.com/earth/columns/record-breakers。 当我尝试获取所有可用链接时,我的程序只返回实际链接的一部分。
如图所示,href属性值仅包含实际链接的一部分。在网站上,当我将鼠标移到文章上时,屏幕左下角会出现一个带有右侧链接的小方框。
我在HTML中没有那么多的知识,但我刚学会了这个被称为" alt"属性,所以我的问题是如何通过Jsoup将这些信息显示在左下角?
答案 0 :(得分:1)
使用abs:attribute前缀解析属性的绝对URL。上面的页面示例:
public static void main (String []args) throws IOException {
Document doc = Jsoup.connect("http://www.bbc.com/earth/columns/record-breakers").get();
Elements link = doc.select("div.promo-unit-header a");
for(Element e : link){
System.out.println(e.attr("abs:href"));
}
}