使用View页面源时缺少Html

时间:2016-09-23 17:11:52

标签: java python html selenium web-scraping

我试图从页面中提取所有图像。我使用了Mechanize Urllib和selenium来提取Html,但我想要提取的部分永远不会存在。此外,当我查看页面源我无法查看我想要提取的部分。而不是我要提取的描述是:

 <div class="loading32"></div>
 </div>

 </div>
 </div>

但是,如果我尝试使用inspect元素选项查看它那里。 有没有一种简单的方法来弄清楚这个脚本在没有任何Java知识的情况下做什么?所以我可以绕过它。或者有没有办法在python 2.7中使用selenium获得等效的inspect元素? View页面源和检查元素之间有什么区别?

2 个答案:

答案 0 :(得分:0)

可能您正在尝试获取使用客户端脚本创建的元素。我不认为当你发送GET / POST请求时就会运行javascript元素(这就是我假设你的意思是“查看源代码”)。

答案 1 :(得分:0)

当时我不知道页面加载后通过js加载了多少内容。 Mechanize没有JavaScript解释器。 我最终解决此问题的方法是从* .js文件中提取链接,并重新获得urllib的推荐并以这种方式获取所需的内容。