我一直在寻找答案,但我似乎找不到任何东西。 通过xml使用lxml到iterparse,我一直在尝试从标签中获取数据。
例如,我有xml:
<line number="0">Line 1</line>
<line number="1">Line 2</line>
<line number="2">Line 3</line>
我需要能够阅读&lt; line number =“2”&gt;。 打印标签仅包括&lt; line&gt;。
谢谢!
编辑:rczajka回答了我的问题(谢谢!),但我想知道:你怎么抽象地这样做 - 不说'数字'?我正在解析的xml是巨大的,我无法完全滚动浏览所有它以查看标签中是否隐藏了任何内容。
rczaika: elem.items()将为您提供所有属性的列表。
谢谢!
答案 0 :(得分:3)
要从etree元素获取信息,您可以这样做:
>>> elem.tag
'line'
>>> elem.get('number')
'2'
>>> elem.text
'Line 3'`