我需要从网站上收集用户的个人资料照片。 我知道python和django,但不知道我该怎么做。
有人可以指导我如何制作python程序,以便我可以列出仅在其网站上说的网站,而不是任何外部链接,并检查该域中的每个页面。
编辑:假设我想在stackoverflow中收集用户的所有thumnail照片。如果我们没有任何所有用户页面并通过。我想通过所有问题页面然后在那里形成抓取照片并使用用户ID保存到hardidsk以便我们不会覆盖
答案 0 :(得分:2)
with open("some_png.png","wb") as f:
f.write(urllib2.urlopen("http://icons-search.com/img/yellowicon/TMNT_lin.zip/lin-png-256x256-Leonardo_256x256.png-256x256.png").read())
找到您需要使用scrappy(或类似框架)的图片网址
有几个关于将它用作蜘蛛的教程(例如http://doc.scrapy.org/en/latest/intro/tutorial.html)