我正在使用Python中的wget库从Twitter中下载经过主题标签过滤的图像。 Twitter使我们能够通过在URL的末尾附加大小来选择想要查看的图像的大小。
例如:https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium
该URL本身可以浏览,但是当我尝试在其上使用wget命令时(wget.download(url)
)。我收到错误
urllib.error.HTTPError: HTTP Error 404: Not Found
当然,当我删除URL末尾的媒体时,我既可以浏览也可以从链接下载。
有人可以告诉我如何使用wget下载具有尺寸说明的图像吗?
答案 0 :(得分:1)
这似乎是Python wget中的错误-我在https://bitbucket.org/techtonik/python-wget/issues/26/urls-with-colon-in-path-404上提出了这个问题
我建议使用requests
。它是更多的代码,但是有效:-)
import requests
image = requests.get("https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium")
if 200 == image.status_code:
with open("image.jpg", 'wb') as f:
f.write(image.content)