刮刮数据uri图像

时间:2013-06-25 22:08:14

标签: python web-scraping uri scrape

我想从网页上抓取图片,问题是图片包含在源代码中作为数据URI。如何将它们保存到文件中? (我只需要从特定的已删除数据URI代码访问URI图像)

1 个答案:

答案 0 :(得分:0)

图像/字符串采用base64编码(甚至在URI本身中说明!)。您所要做的就是解码它,然后将其写入文件。

imageContents = "/9j/4AAQSkZJRgABAQAAAQABAAD/2wCEAAkGBxQSEhUUE"
myfile = open("image.jpg","w")
myfile.write(imageContents.decode("base64"))
myfile.close()