jsoup没有抓取页面上的所有图像

时间:2014-03-20 18:19:06

标签: java html jsoup

尝试从此page获取图片。

使用下面显示的代码,它只获取侧面图像,如徽标等,但不会获取显示数据的图像。

public static void main (String args[])
{   
    Document doc;
    try {       
        doc = Jsoup.connect("http://www.wolframalpha.com/input/?i=hepatitis").get();
        Elements desc =doc.select("img[src]");                               
        {
            for (Element link :desc)                
            System.out.println("text :"+link.absUrl("src"));
        }
    } catch (IOException e) {
        System.out.println(e);
    }  
}
}

我甚至尝试使用他们的ID来获取图片:

Elements desc =doc.select("#scannerresult_0300_1 img[src]");

但它没有返回任何结果。

1 个答案:

答案 0 :(得分:0)

该网站根据 javascripts 生成大量内容。遗憾的是Jsoup不支持这些,因此脚本执行,因此不会生成任何内容。

请参阅此答案以获取更多信息:Fetch contents(loaded through AJAX call) of a web page