如何从特定链接检索特定图像? (编程初学者)

时间:2017-12-07 18:06:14

标签: image python-2.7 beautifulsoup urllib2 imdb

我是编程初学者 - 如果这个问题不合适,请道歉。我已经尽力在互联网上搜索今天更好的部分。 我尝试从此链接检索图片:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992

我正在使用以下代码:(我知道它会获取所有图像。)

我的问题是 - 为什么此代码适用于此链接:http://www.imdb.com/title/tt0076759/?ref_=nv_sr_5但不在此链接上:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992

import urllib2
import os
from BeautifulSoup import BeautifulSoup

URL = "http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992"
default_dir = os.path.join(os.path.expanduser("~"),"Pictures")
opener = urllib2.build_opener()
urllib2.install_opener(opener)
soup = BeautifulSoup(urllib2.urlopen(URL).read())
imgs = soup.findAll("img",{"alt":True, "src":True})

for img in imgs:
    img_url = img["src"]
    filename = os.path.join(default_dir, img_url.split("/")[-1])
    img_data = opener.open(img_url)
    f = open(filename,"wb")
    f.write(img_data.read())
    f.close()

我想从此链接中获取图片:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992

我目前没有从此链接获得上述代码的图像。它可以与其他链接一起使用。

1 个答案:

答案 0 :(得分:1)

这是因为该网址中的img代码不具有alt属性,您可以使用该属性来过滤这些img代码:

imgs = soup.findAll("img",{"alt":True, "src":True})

该列表返回空。