试图创建一个简单的程序来获取维基百科的最新变化并解析该XML文件。
我坚持认为findall()无效。我做错了什么?
import urllib2
from lxml import etree as ET
result = urllib2.urlopen('http://en.wikipedia.org/w/api.php?action=query&format=xml&list=recentchanges&rcprop=title|ids|sizes|flags|user|timestamp').read()
xml=ET.fromstring (result)
print xml[0][0][0].attrib # that works!
print xml.findall ('api/query/recentchanges/rc') # that don't!
答案 0 :(得分:3)
我怀疑根节点是主题节点,因此它正在根节点内寻找名为“api”的节点。如果是这样,以下两个都将起作用:
query/recentchanges/rc
/api/query/recentchanges/rc