我在解析特定样式的XML时遇到了困难。
XML文件如下所示:
<channels>
<genre type = blah1>
<channel name="Channel 1">
<show>
<title>hello</title>
</show>
</channel>
<channel name="Channel 2">
<show>
<title>hello</title>
</show>
</channel>
</genre>
<genre type="blah2">
<channel name="Channel 3">
<show>
<title>hello</title>
</show>
</channel>
</genre>
</channels>
所以我的问题如下:
channelList = rootElem.find(".//channel[@name]")
howManyChannels = len(channelList)
for x in range(1, howManyChannels):
print x
print rootElem.find(".//channel[@name]["+str(x)+"]").get('name')
for y in rootElem.find(".//channel[@name]["+str(x)+"]"):
print y.findtext('title')
这将进入第2频道,然后出现以下错误:
Traceback (most recent call last):
File "parse.py", line 17, in <module>
print rootElem.find(".//channel[@name]["+str(x)+"]").get('name')
AttributeError: 'NoneType' object has no attribute 'get'
为什么不代码:
for y in rootElem.find(".//channel[@name]["+str(x)+"]"):
包括第三个频道,为什么它被隔离,因为它在另一个类型标签中?如何更改代码以适应此目的?
我正试图在列表中存储哪些频道与节目有关。
更新: 我不明白为什么
channelList = rootElem.find(".//channel[@name][3]")
甚至在循环之外产生错误。
url = 'myxmlurl.com/xml.xml'
request = urllib2.Request(url, headers={"Accept" : "application/xml"})
u = urllib2.urlopen(request)
tree = ElementTree.parse(u)
rootElem = tree.getroot()
答案 0 :(得分:0)
首先,发布的代码在语法上没有效果,因为它没有缩进。但是,问题的根源在于您正在使用range
进行迭代。
而不是:
channelList = rootElem.find(".//channel[@name]")
howManyChannels = len(channelList)
for x in range(1, howManyChannels):
执行:
channelList = rootElem.find(".//channel[@name]")
for channel in channelList:
pass #whatever
这样,您无需再次搜索频道。
此外,您的搜索“无效”,因为没有名为"3"
的频道元素。尝试搜索"Channel 3"
。