我有一个旧项目正在通过urllib下载图片。
有时,下载的图像已损坏。
以下图为例,
https://images.allsaints.com/products/900/WO053N/2824/WO053N-2824-1.jpg
当我尝试在Image Viewer中打开它时,我得到了
Error interpreting JPEG image file (Not a JPEG file: starts with 0x3c 0x21)
原来,这是一个html文件。
所以,我读了这个答案,
How to test if a webpage is an image
所以,我检查了这张图片的标题,
>>> b = requests.get('https://images.allsaints.com/products/900/WO053N/2824/WO053N-2824-1.jpg')
>>> b.headers.get('content-type')
'image/jpeg'
它在标题中显示它是一个image / jpeg,但实际上它是HTML页面。
那么,我怎样才能正确检查网址是图片还是HTML?