自动化JPEG下载

时间:2010-11-20 09:52:18

标签: python

我需要下载尺寸为>的jpeg图片来自页面1< = PAGE_NUMBER< = NUM​​_OF_PAGES

的MIN_SIZE

http://somewebsite.com/showthread.php?t=12345&page=PAGE_NUMBER

我怎么能在python中做到这一点?我是python的新手。

1 个答案:

答案 0 :(得分:1)

以下是我在Python中的表现:

  • 获取从中获取图像所需的每个页面(简单,只需使用mechanize或其他一些HTTP提取程序库)
  • 解析每个HTML文件以获取图片网址。这有点复杂 - 看看HTMLParser。从内存中,您可以将HTMLParser子类化为仅抓取您感兴趣的文本。在这种情况下,这是HTML src标记中的img属性,例如像<img src="this is what you want" width=640 height=480/>
  • 之类的东西
  • 获取上面获得的每个图像(简单)

但就个人而言,我不会使用Python。使用wget可以轻松完成上述方法的第一步和最后一步。第二个可以使用grep执行,bash可以将所有内容绑定在一起。事实上,这正是我推荐的here

当然,如果您使用的是Linux。如果你没有bash并且获得Python可能是你的下一个最佳选择。