如何使用Python机制来保存页面上包含图像的页面

时间:2011-08-07 07:54:24

标签: python screen-scraping mechanize

所以我理解机械化可以使python脚本的行为与浏览器完全相同。 使用浏览器,我可以将加载的页面保存到本地磁盘,包括页面中的图像 我怎么能用机械化呢? 它似乎无法在页面上保存图像

我正在使用This page中的示例 提前致谢

1 个答案:

答案 0 :(得分:3)

没有直接的方法可以做到这一点,但这里是你需要采取的步骤

  • 使用mechanize或urllib2
  • 打开页面
  • 获取html
  • 使用lxml解析html
  • 查找所有图片网址
  • 为每个图片网址用mechanize或urllib2打开并保存

在这种情况下,如果你只想处理一个页面并且你不需要登录就可以获得它,那么mechanize并不能真正为你提供任何东西。您可能会发现requests对此任务很有用。