HTML源代码(请注意,它使用了延迟加载jQuery插件):
1)。当我在下面运行代码时,它会从网站上获取所有图片网址:
Elements images=document.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
2)。但是当我指定它失败的类时,如下所示:
Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]");
然后我使用(在第二种情况下它会抛出OutOfBoundsException):
for (int i=0;i<images.size();i++){
imageUrl[i]=images.get(i).attr("src");
}
无论如何,懒惰负载可能会出现问题,如果是,如何解决?
答案 0 :(得分:0)
我找到了改变工作的方法
Elements images=document.select("div.newscat img[src~=(?i)\\.(png|jpe?g|gif)]");
for (int i=0;i<images.size();i++){
imageUrl[i]=images.get(i).attr("src");
}
到
Elements images=document.select("div.newscat").select("img");
for (int i=0;i<images.size();i++){
imageUrl[i]=images.get(i).attr("data-original");
}