Java Jsoup extract" alt"

时间:2016-05-04 07:11:46

标签: java html css web

我正在尝试抓取此网页:http://www.bbc.com/earth/columns/record-breakers。 当我尝试获取所有可用链接时,我的程序只返回实际链接的一部分。

如图所示,href属性值仅包含实际链接的一部分。在网站上,当我将鼠标移到文章上时,屏幕左下角会出现一个带有右侧链接的小方框。

我在HTML中没有那么多的知识,但我刚学会了这个被称为" alt"属性,所以我的问题是如何通过Jsoup将这些信息显示在左下角?

enter image description here

1 个答案:

答案 0 :(得分:1)

使用abs:attribute前缀解析属性的绝对URL。上面的页面示例:

 public static void main (String []args) throws IOException {

    Document doc = Jsoup.connect("http://www.bbc.com/earth/columns/record-breakers").get();
    Elements link = doc.select("div.promo-unit-header a");      

    for(Element e : link){
        System.out.println(e.attr("abs:href"));                    
    }       

}