我是编程初学者 - 如果这个问题不合适,请道歉。我已经尽力在互联网上搜索今天更好的部分。 我尝试从此链接检索图片:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992
我正在使用以下代码:(我知道它会获取所有图像。)
我的问题是 - 为什么此代码适用于此链接:http://www.imdb.com/title/tt0076759/?ref_=nv_sr_5但不在此链接上:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992?
import urllib2
import os
from BeautifulSoup import BeautifulSoup
URL = "http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992"
default_dir = os.path.join(os.path.expanduser("~"),"Pictures")
opener = urllib2.build_opener()
urllib2.install_opener(opener)
soup = BeautifulSoup(urllib2.urlopen(URL).read())
imgs = soup.findAll("img",{"alt":True, "src":True})
for img in imgs:
img_url = img["src"]
filename = os.path.join(default_dir, img_url.split("/")[-1])
img_data = opener.open(img_url)
f = open(filename,"wb")
f.write(img_data.read())
f.close()
我想从此链接中获取图片:http://www.imdb.com/title/tt0076759/mediaviewer/rm2809748992
我目前没有从此链接获得上述代码的图像。它可以与其他链接一起使用。
答案 0 :(得分:1)
这是因为该网址中的img
代码不具有alt
属性,您可以使用该属性来过滤这些img
代码:
imgs = soup.findAll("img",{"alt":True, "src":True})
该列表返回空。