LXML迭代解析标记信息

时间:2011-08-31 18:57:28

标签: python xml parsing lxml

我一直在寻找答案,但我似乎找不到任何东西。 通过xml使用lxml到iterparse,我一直在尝试从标签中获取数据。

例如,我有xml:

<line number="0">Line 1</line>
<line number="1">Line 2</line> 
<line number="2">Line 3</line> 

我需要能够阅读&lt; line number =“2”&gt;。 打印标签仅包括&lt; line&gt;。

谢谢!

编辑:rczajka回答了我的问题(谢谢!),但我想知道:你怎么抽象地这样做 - 不说'数字'?我正在解析的xml是巨大的,我无法完全滚动浏览所有它以查看标签中是否隐藏了任何内容。

rczaika: elem.items()将为您提供所有属性的列表。

谢谢!

1 个答案:

答案 0 :(得分:3)

要从etree元素获取信息,您可以这样做:

>>> elem.tag
'line'
>>> elem.get('number')
'2'
>>> elem.text
'Line 3'`