我熟悉使用urllib.urlretrieve从在线抓取图片(例如此处解释:https://stackoverflow.com/a/3042786/)。
我想抓取一组图片,其中网址以/get.aspx?1234
结尾(带有不同的编号后缀)。我不确切知道aspx是如何工作的,但我知道当我尝试使用urllib.urlretrieve来抓取图像时它并没有起作用。我可以使用哪些其他功能?
当我在我的浏览器中以/get.aspx?1234
结尾的网址时,我只会看到一个图像,显示我可以右键单击并另存为jpeg。当我在新标签页中点击打开图片时,我会得到以/get.aspx?1234
结尾的完全相同的网址。我不知道用什么来更好地识别这张图片。
答案 0 :(得分:0)
检查在浏览器中打开图像时发送的标题。服务器可以以某种方式检查它们以防止自动下载。 因此,基本上,当您以编程方式请求URL时,需要保留相同的标题。