我怎么能从网站上用python抓取一些照片

时间:2012-11-08 04:53:05

标签: python database web-scraping

我需要从网站上收集用户的个人资料照片。 我知道python和django,但不知道我该怎么做。

有人可以指导我如何制作python程序,以便我可以列出仅在其网站上说的网站,而不是任何外部链接,并检查该域中的每个页面。

编辑:假设我想在stackoverflow中收集用户的所有thumnail照片。如果我们没有任何所有用户页面并通过。我想通过所有问题页面然后在那里形成抓取照片并使用用户ID保存到hardidsk以便我们不会覆盖

1 个答案:

答案 0 :(得分:2)

with open("some_png.png","wb") as f:
     f.write(urllib2.urlopen("http://icons-search.com/img/yellowicon/TMNT_lin.zip/lin-png-256x256-Leonardo_256x256.png-256x256.png").read())

找到您需要使用scrappy(或类似框架)的图片网址

有几个关于将它用作蜘蛛的教程(例如http://doc.scrapy.org/en/latest/intro/tutorial.html