Python:忽略elementtree.ElementTree中的xmlns

时间:2012-06-27 12:30:26

标签: python xml xml-namespaces elementtree

有没有办法忽略elementtree.ElementTree中的tage名称中的XML命名空间?

我尝试打印所有technicalContact代码:

for item in root.getiterator(tag='{http://www.example.com}technicalContact'):
        print item.tag, item.text

我得到类似的东西:

{http://www.example.com}technicalContact blah@example.com

但我真正想要的是:

technicalContact blah@example.com

有没有办法只显示后缀(没有xmlns),或者更好 - 迭代元素而不明确说明xmlns?

2 个答案:

答案 0 :(得分:8)

您可以定义一个生成器,以递归方式搜索元素树,以查找以相应标记名称结尾的标记。例如,像这样:

def get_element_by_tag(element, tag):
    if element.tag.endswith(tag):
        yield element
    for child in element:
        for g in get_element_by_tag(child, tag):
            yield g

这只检查以tag结尾的标记,即忽略任何前导命名空间。然后,您可以按如下方式迭代所需的任何标记:

for item in get_element_by_tag(elemettree, 'technicalContact'):
    ...

此生成器正在运行:

>>> xml_str = """<root xmlns="http://www.example.com">
... <technicalContact>Test1</technicalContact>
... <technicalContact>Test2</technicalContact>
... </root>
... """

xml_etree = etree.fromstring(xml_str)

>>> for item in get_element_by_tag(xml_etree, 'technicalContact')
...     print item.tag, item.text
... 
{http://www.example.com}technicalContact Test1
{http://www.example.com}technicalContact Test2

答案 1 :(得分:0)

我总是使用像

这样的东西
item.tag.split("}")[1][0:]