Python:拥有正确的图片网址,无法下载图片

时间:2014-04-15 20:08:52

标签: python-2.7 web-scraping beautifulsoup

我正在为图片获取正确的网址。但我似乎无法下载图像并将其保存到文件中。我是python的新手所以任何指导都会非常感激。我已经尝试了其他几个文章来源,并且在我获得网址后下载图像没有任何问题。猜猜它不喜欢非洲?

url: http://www.africom.mil/Newsroom/Article/12058/multinational-participation-plays-key-factor-to-exercise-african-lion

soup = BeautifulSoup(urllib2.urlopen(url).read())

links = soup.find("div", {'class': 'usafricom_ArticlePhotoContainer'}).find_all('img', src=True)
for link in links:
        imgfile = open('%s' % timestamp + "_" + title.encode("utf-8") + ".jpg", "wb")
        link = link["src"].split("src=")[-1]
        imgurl = "www.africom.mil" + link + ".jpg"
        download_img = urllib2.urlopen(imgurl).read()
        imgfile.write(download_img)
        imgfile.close()

1 个答案:

答案 0 :(得分:1)

我不确定您在代码中看到的错误是什么。你的问题没有提到错误。当我尝试你的代码时,我遇到了这个错误:

ValueError: unknown url type: www.africom.mil/Image/12059/High/030414-M-XI134-002.jpg

此错误是由于代码中的这一行:

imgurl = "www.africom.mil" + link + ".jpg"

它没有指定http协议。将其更改为:

imgurl = "http://www.africom.mil" + link + ".jpg"

并检查。这个改变对我有用。