我试图分析不同的网站,找到它包含的所有图片。
现在我使用Jsoup使用以下代码:
Elements imagePath = doc.select("[src]");
e.attr("abs:src")
现在,当我在域名上运行时,我会得到很多图像,但如果我尝试在子域上运行相同的东西,我会得到相同的图像
例如,网站http://www.example.com会提取与http://www.example.com/page1
相同的输出现在我的问题是JSoup是否找到了域中所有子网站的所有图像,或者只是随机运气它会产生相同的输出?
答案 0 :(得分:1)
您是否正在更新Document
对象?我的猜测是(因为没有提供有价值的代码)你已经将你的域解析为doc
而你没有对子域做同样的事情。 Jsoup仅将您的选择应用于当前文档节点,与子域/页面等无关。(因为它甚至不必是一个网站)。