我正在为图片获取正确的网址。但我似乎无法下载图像并将其保存到文件中。我是python的新手所以任何指导都会非常感激。我已经尝试了其他几个文章来源,并且在我获得网址后下载图像没有任何问题。猜猜它不喜欢非洲?
url: http://www.africom.mil/Newsroom/Article/12058/multinational-participation-plays-key-factor-to-exercise-african-lion
soup = BeautifulSoup(urllib2.urlopen(url).read())
links = soup.find("div", {'class': 'usafricom_ArticlePhotoContainer'}).find_all('img', src=True)
for link in links:
imgfile = open('%s' % timestamp + "_" + title.encode("utf-8") + ".jpg", "wb")
link = link["src"].split("src=")[-1]
imgurl = "www.africom.mil" + link + ".jpg"
download_img = urllib2.urlopen(imgurl).read()
imgfile.write(download_img)
imgfile.close()
答案 0 :(得分:1)
我不确定您在代码中看到的错误是什么。你的问题没有提到错误。当我尝试你的代码时,我遇到了这个错误:
ValueError: unknown url type: www.africom.mil/Image/12059/High/030414-M-XI134-002.jpg
此错误是由于代码中的这一行:
imgurl = "www.africom.mil" + link + ".jpg"
它没有指定http协议。将其更改为:
imgurl = "http://www.africom.mil" + link + ".jpg"
并检查。这个改变对我有用。