Question

我正在尝试从多个网址获取元数据。我有这段代码：

from urllib import urlopen
from lxml import etree

f = urlopen('http://www.google.com',
        'http://www.youtube.com').read()

tree = etree.HTML(f)
m = tree.xpath( "//meta")

for i in m:
    print etree.tostring(i)

但结果只显示给定的第一个网址的元数据。我想我必须做一个循环所以该函数也将在第二个URL上运行，但我不确定如何做到这一点......

Answer 1

urlopen只接受一个网址，因此您无法以这种方式获取多个网站 - 特别是不能一次获取。每个网址都需要一次：

for url in ('http://www.google.com', 'http://www.youtube.com'):
    f = urlopen(url).read()
    tree = etree.HTML(f)
    …

如何对此进行循环？

1 个答案: