应用错误收集

时间：2015-05-22 03:39:30

标签： python download

我熟悉使用urllib.urlretrieve从在线抓取图片（例如此处解释：https://stackoverflow.com/a/3042786/）。

我想抓取一组图片，其中网址以/get.aspx?1234结尾（带有不同的编号后缀）。我不确切知道aspx是如何工作的，但我知道当我尝试使用urllib.urlretrieve来抓取图像时它并没有起作用。我可以使用哪些其他功能？

当我在我的浏览器中以/get.aspx?1234结尾的网址时，我只会看到一个图像，显示我可以右键单击并另存为jpeg。当我在新标签页中点击打开图片时，我会得到以/get.aspx?1234结尾的完全相同的网址。我不知道用什么来更好地识别这张图片。

答案 0 :(得分：0)

检查在浏览器中打开图像时发送的标题。服务器可以以某种方式检查它们以防止自动下载。因此，基本上，当您以编程方式请求URL时，需要保留相同的标题。