我正在尝试从多个网址获取元数据。我有这段代码:
from urllib import urlopen
from lxml import etree
f = urlopen('http://www.google.com',
'http://www.youtube.com').read()
tree = etree.HTML(f)
m = tree.xpath( "//meta")
for i in m:
print etree.tostring(i)
但结果只显示给定的第一个网址的元数据。我想我必须做一个循环所以该函数也将在第二个URL上运行,但我不确定如何做到这一点......
答案 0 :(得分:2)
urlopen
只接受一个网址,因此您无法以这种方式获取多个网站 - 特别是不能一次获取。每个网址都需要一次:
for url in ('http://www.google.com', 'http://www.youtube.com'):
f = urlopen(url).read()
tree = etree.HTML(f)
…