python:通过urllib下载时图像损坏

时间:2018-04-06 11:22:43

标签: python html image http-headers urllib

我有一个旧项目正在通过urllib下载图片。

有时,下载的图像已损坏。

以下图为例,

https://images.allsaints.com/products/900/WO053N/2824/WO053N-2824-1.jpg

当我尝试在Image Viewer中打开它时,我得到了

Error interpreting JPEG image file (Not a JPEG file: starts with 0x3c 0x21)

原来,这是一个html文件。

所以,我读了这个答案,

How to test if a webpage is an image

所以,我检查了这张图片的标题,

>>> b = requests.get('https://images.allsaints.com/products/900/WO053N/2824/WO053N-2824-1.jpg')
>>> b.headers.get('content-type')
'image/jpeg'

它在标题中显示它是一个image / jpeg,但实际上它是HTML页面。

那么,我怎样才能正确检查网址是图片还是HTML?

0 个答案:

没有答案