我应该如何在python中解析这个xml字符串?

时间:2013-01-04 09:00:08

标签: python xml elementtree

我的XML字符串是 -

xmlData = """<SMSResponse xmlns="http://example.com" xmlns:i="http://www.w3.org/2001/XMLSchema-instance">
             <Cancelled>false</Cancelled>
             <MessageID>00000000-0000-0000-0000-000000000000</MessageID>  
             <Queued>false</Queued>
             <SMSError>NoError</SMSError>
             <SMSIncomingMessages i:nil="true"/>
             <Sent>false</Sent>
             <SentDateTime>0001-01-01T00:00:00</SentDateTime>
             </SMSResponse>"""

我正在尝试解析并获取标记的值 - Canceled,MessageId,SMSError等。我正在使用python的Elementtree库。到目前为止,我尝试过像

这样的事情
root = ET.fromstring(xmlData)
print root.find('Sent')  // gives None
for child in root:
    print chil.find('MessageId') // also gives None

虽然,我可以用 -

打印标签
for child in root:
    print child.tag
    //child.tag for the tag Cancelled is - {http://example.com}Cancelled

及其各自的值 -

for child in root:
    print child.text

我如何获得类似的内容 -

print child.Queued // will print false

与PHP一样,我们可以使用root访问它们 -

$xml = simplexml_load_string($data);
$status = $xml->SMSError;

4 个答案:

答案 0 :(得分:7)

您的文档上有一个命名空间,您需要在搜索时包含命名空间:

root = ET.fromstring(xmlData)
print root.find('{http://example.com}Sent',)
print root.find('{http://example.com}MessageID')

输出:

<Element '{http://example.com}Sent' at 0x1043e0690>
<Element '{http://example.com}MessageID' at 0x1043e0350>

find()findall()方法也采用命名空间映射;您可以搜索任意前缀,并在该地图中查找前缀,以节省输入:

nsmap = {'n': 'http://example.com'}
print root.find('n:Sent', namespaces=nsmap)
print root.find('n:MessageID', namespaces=nsmap)

答案 1 :(得分:3)

如果您使用的是Python标准XML库,则可以使用以下内容:

root = ET.fromstring(xmlData)
namespace = 'http://example.com'

def query(tree, nodename):
    return tree.find('{{{ex}}}{nodename}'.format(ex=namespace, nodename=nodename))

queued = query(root, 'Queued')
print queued.text

答案 2 :(得分:2)

您可以创建字典并直接从中获取值...

tree = ET.fromstring(xmlData)

root = {}

for child in tree:
    root[child.tag.split("}")[1]] = child.text

print root["Queued"]

答案 3 :(得分:2)

使用lxml.etree

In [8]: import lxml.etree as et

In [9]: doc=et.fromstring(xmlData)

In [10]: ns={'n':'http://example.com'}

In [11]: doc.xpath('n:Queued/text()',namespaces=ns)
Out[11]: ['false']

使用elementtree即可:

import xml.etree.ElementTree as ET    
root=ET.fromstring(xmlData)    
ns={'n':'http://example.com'}
root.find('n:Queued',namespaces=ns).text
Out[13]: 'false'