如何使用python在xml文件中获取内部元素

时间:2012-12-17 17:12:44

标签: python xml

我有下一个xml:

<a>
  <aa id = 1>
    <data>aaaa</data>
  </aa>
  <aa id = 2>
    <data>bbbb</data>
  </aa>
  <aa id = 3>
    <data>cccc</data>
  </aa>
</a>

我想要访问数据的文本(aaaa,bbbb ...) 我该怎么做 ? (我一直在使用etree.ElementTree包)

3 个答案:

答案 0 :(得分:1)

XML文件:

<?xml version="1.0"?>
<a>
  <aa id="1">
    <data>aaaa</data>
   </aa>
   <aa id="2">
    <data>bbbb</data>
  </aa>
  <aa id="3">
    <data>cccc</data>
  </aa>
</a>

您可以使用XPath查询:

from lxml import etree

xml = etree.parse('/tmp/a.xml')

xml.xpath('.//data/text()')
['aaaa', 'bbbb', 'cccc'] #returns that

答案 1 :(得分:1)

你可以试试这个:

In [1]: import xml.etree.ElementTree as ET

In [2]: tree = ET.parse('test.xml')

In [3]: root = tree.getroot()

In [4]: for el in root:
   ...:     print el.find('data').text
   ...:     
   ...:     
aaaa
bbbb
cccc

您提供的代码中唯一缺少的是elem.find('data').text(在for循环内) - 这将返回您要查找的值。

答案 2 :(得分:0)

tree = xml.parse(file) 
root = tree.getroot() 
listElem = root.findall("aa") 
for elem in listElem:
     tmp1 = elem.findall("data")
     str = tmp1[0].text