我有这个代码,我想下载图像并将其保存到一个文件夹但我得到图像的src。我已经通过堆栈溢出我发现这个Batch downloading text and images from URL with Python / urllib / beautifulsoup?但不知道如何进行
这是我的代码,到目前为止我已经尝试了
elm5=soup.find('div', id="dv-dp-left-content")
img=elm5.find("img")
src = img["src"]
print src
如何使用网址将这些图片下载到文件夹
答案 0 :(得分:2)
import urllib
f = open('local_file_name','wb')
f.write(urllib.urlopen(src).read())
f.close()
src
必须是完整路径 - 例如http://hostname.com/folder1/folder2/filename.ext
。
如果src
为/folder1/folder2/filename.ext
,您必须添加http://hostname.com/
如果src
为folder2/filename.ext
,则必须添加http://hostname.com/folder1/
等
编辑:示例如何下载StackOverflow徽标:)
import urllib
f = open('stackoverflow.png','wb')
f.write(urllib.urlopen('http://cdn.sstatic.net/stackoverflow/img/sprites.png?v=3c6263c3453b').read())
f.close()
答案 1 :(得分:1)
src
属性包含图片的网址。
您可以下载:
urllib.request.urlretrieve(src, "image.jpg")