从lxml中的属性获取本地名称

时间:2019-02-07 15:34:40

标签: python lxml xml-namespaces

问题:

我可以使用element.tag来获得lxml.etree.QName(element).localname而不带名称空间的名称。
如何与element.attrib类似?


示例:

假设此XML文件:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<root xmlns="some_ns" xmlns:soc="some_other_ns" >
    <someTag attr1="something" soc:attr2="something else"></someTag>
</root>

此脚本返回attrib,其中包含第二个属性的命名空间:

from lxml import etree
root = etree.parse('test.xml').getroot()
ns = { 'n':'some_ns', 'son':'some_other_ns' }
print ([e.attrib for e in root.xpath('./n:someTag', namespaces = ns)])

输出:

[{'{some_other_ns}attr2': 'something else', 'attr1': 'something'}]

2 个答案:

答案 0 :(得分:1)

您也可以将QName用于属性。

tag = root.xpath('./n:someTag', namespaces = ns)[0]
for a, v in tag.attrib.items():
    print(etree.QName(a).localname, v)

输出:

attr1 something
attr2 something else

答案 1 :(得分:0)

由于@mzjn的回答,我可以编写一个函数来像e.attrib一样输出属性。

from lxml import etree
root = etree.parse('test.xml').getroot()
ns = { 'n':'some_ns', 'son':'some_other_ns' }

def attrib_localnames(a):
    out={}
    for n,v in a.attrib.items():
        out[etree.QName(n).localname]=v
    return out

print ([attrib_localnames(e) for e in root.xpath('./n:someTag', namespaces = ns)])

输出:

[{'attr1': 'something', 'attr2': 'something else'}]