网页抓取 - 如何将图像下载到文件夹python中

时间:2014-06-19 10:21:27

标签: python image beautifulsoup

我有这个代码,我想下载图像并将其保存到一个文件夹但我得到图像的src。我已经通过堆栈溢出我发现这个Batch downloading text and images from URL with Python / urllib / beautifulsoup?但不知道如何进行

这是我的代码,到目前为止我已经尝试了

elm5=soup.find('div', id="dv-dp-left-content")
img=elm5.find("img")
src = img["src"]
print src

如何使用网址将这些图片下载到文件夹

2 个答案:

答案 0 :(得分:2)

import urllib

f = open('local_file_name','wb')
f.write(urllib.urlopen(src).read())
f.close()

src必须是完整路径 - 例如http://hostname.com/folder1/folder2/filename.ext

如果src/folder1/folder2/filename.ext,您必须添加http://hostname.com/ 如果srcfolder2/filename.ext,则必须添加http://hostname.com/folder1/


编辑:示例如何下载StackOverflow徽标:)

import urllib

f = open('stackoverflow.png','wb')
f.write(urllib.urlopen('http://cdn.sstatic.net/stackoverflow/img/sprites.png?v=3c6263c3453b').read())
f.close()

答案 1 :(得分:1)

src属性包含图片的网址。

您可以下载:

urllib.request.urlretrieve(src, "image.jpg")