无法在特定类(JSOUP)中获取图像Url(使用data-original定义)

时间:2016-04-02 13:18:48

标签: java android jsoup urlfetch

HTML源代码(请注意,它使用了延迟加载jQuery插件): enter image description here

1)。当我在下面运行代码时,它会从网站上获取所有图片网址:

    Elements images=document.select("img[src~=(?i)\\.(png|jpe?g|gif)]");

2)。但是当我指定它失败的类时,如下所示:

    Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]");
  

然后我使用(在第二种情况下它会抛出OutOfBoundsException):

for (int i=0;i<images.size();i++){
  imageUrl[i]=images.get(i).attr("src");
}
  

无论如何,懒惰负载可能会出现问题,如果是,如何解决?

1 个答案:

答案 0 :(得分:0)

最后,感谢android: how can i scrap images (in url ) using jsoup?(Image tag contain attribute "data-original" which is url of image)

我找到了改变工作的方法

Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]");
for (int i=0;i<images.size();i++){
  imageUrl[i]=images.get(i).attr("src");
}

Elements images=document.select("div.newscat").select("img");
for (int i=0;i<images.size();i++){
  imageUrl[i]=images.get(i).attr("data-original");
}