通过BeautifulSoup从网页下载图像数据URI

时间:2015-05-15 19:18:38

标签: python python-2.7 beautifulsoup

我需要使用Python从网站检索图像。但是,图像不是链接文件的形式,而是GIF数据URI。如何下载并将其存储在.gif文件中?

1 个答案:

答案 0 :(得分:3)

这应该让你朝着正确的方向前进。

首先,我假设您已检索到图像uri数据,并将其保存在名为img_data的python变量中:

# Example
img_data = 'data:image/jpeg;base64,/9j/4A...<lots of data>...k='

现在您需要解码base64中的图片并将其保存到文件中:

import base64

# Separate the metadata from the image data
head, data = img_data.split(',', 1)

# Get the file extension (gif, jpeg, png)
file_ext = head.split(';')[0].split('/')[1]

# Decode the image data
plain_data = base64.b64decode(data)

# Write the image to a file
with open('image.' + file_ext, 'wb') as f:
    f.write(plain_data)