Question

我试图从页面中提取所有图像。我使用了Mechanize Urllib和selenium来提取Html，但我想要提取的部分永远不会存在。此外，当我查看页面源我无法查看我想要提取的部分。而不是我要提取的描述是：

 <div class="loading32"></div>
 </div>

 </div>
 </div>

但是，如果我尝试使用inspect元素选项查看它那里。有没有一种简单的方法来弄清楚这个脚本在没有任何Java知识的情况下做什么？所以我可以绕过它。或者有没有办法在python 2.7中使用selenium获得等效的inspect元素？ View页面源和检查元素之间有什么区别？

Answer 1

可能您正在尝试获取使用客户端脚本创建的元素。我不认为当你发送GET / POST请求时就会运行javascript元素（这就是我假设你的意思是“查看源代码”）。

Answer 2

当时我不知道页面加载后通过js加载了多少内容。 Mechanize没有JavaScript解释器。我最终解决此问题的方法是从* .js文件中提取链接，并重新获得urllib的推荐并以这种方式获取所需的内容。