我有以下xml文件
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
<neighbor name="Malaysia" direction="N"/>
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year>2011</year>
<gdppc>13600</gdppc>
<neighbor name="Costa Rica" direction="W"/>
<neighbor name="Colombia" direction="E"/>
</country>
</data>
我想使用ElementTree编写python 3代码来获取所有国家/地区名称。因此,最终结果应为dict
或array
[ '列支敦士登', '新加坡', '巴拿马']
我正在尝试使用Xpath执行此操作,但无处可去。所以我的代码如下
import xml.etree.ElementTree as ET
tree = ET.parse(xmlfile)
root = tree.getroot()
names = root.findall("./country/@name")
但是上面的方法不起作用,因为我觉得我的xpath错了。
答案 0 :(得分:3)
使用findall()
获取所有country
代码,并从.attrib
词典中获取name
属性:
import xml.etree.ElementTree as ET
data = """your xml here"""
tree = ET.fromstring(data)
print([el.attrib.get('name') for el in tree.findall('.//country')])
打印['Liechtenstein', 'Singapore', 'Panama']
。
请注意,由于//country/@name
仅提供limited Xpath support,因此无法使用xpath表达式xml.etree.ElementTree
获取属性值。
仅供参考,lxml
提供更完整的xpath支持,因此可以更轻松地获取属性值:
from lxml import etree as ET
data = """your xml here"""
tree = ET.fromstring(data)
print(tree.xpath('//country/@name'))
打印['Liechtenstein', 'Singapore', 'Panama']
。
答案 1 :(得分:0)
您可以使用
import xml.etree.ElementTree as ET
xml=ET.fromstring(contents)
xml.find('./element').attrib['key']
Chek the source here