Question

我有这个代码，我想下载图像并将其保存到一个文件夹但我得到图像的src。我已经通过堆栈溢出我发现这个Batch downloading text and images from URL with Python / urllib / beautifulsoup?但不知道如何进行

这是我的代码，到目前为止我已经尝试了

elm5=soup.find('div', id="dv-dp-left-content")
img=elm5.find("img")
src = img["src"]
print src

如何使用网址将这些图片下载到文件夹

Answer 1

import urllib

f = open('local_file_name','wb')
f.write(urllib.urlopen(src).read())
f.close()

src必须是完整路径 - 例如http://hostname.com/folder1/folder2/filename.ext。

如果src为/folder1/folder2/filename.ext，您必须添加http://hostname.com/ 如果src为folder2/filename.ext，则必须添加http://hostname.com/folder1/ 等

编辑：示例如何下载StackOverflow徽标：）

import urllib

f = open('stackoverflow.png','wb')
f.write(urllib.urlopen('http://cdn.sstatic.net/stackoverflow/img/sprites.png?v=3c6263c3453b').read())
f.close()

Answer 2

src属性包含图片的网址。

您可以下载：

urllib.request.urlretrieve(src, "image.jpg")

网页抓取 - 如何将图像下载到文件夹python中

2 个答案: