JSoup是否找到所有图像

时间:2013-08-06 07:49:31

标签: java jsoup

我试图分析不同的网站,找到它包含的所有图片。

现在我使用Jsoup使用以下代码:

      Elements imagePath = doc.select("[src]");
      e.attr("abs:src")

现在,当我在域名上运行时,我会得到很多图像,但如果我尝试在子域上运行相同的东西,我会得到相同的图像

例如,网站http://www.example.com会提取与http://www.example.com/page1

相同的输出

现在我的问题是JSoup是否找到了域中所有子网站的所有图像,或者只是随机运气它会产生相同的输出?

1 个答案:

答案 0 :(得分:1)

您是否正在更新Document对象?我的猜测是(因为没有提供有价值的代码)你已经将你的域解析为doc而你没有对子域做同样的事情。 Jsoup仅将您的选择应用于当前文档节点,与子域/页面等无关。(因为它甚至不必是一个网站)。