使用lxml lib读取xml从xmlns标记中获取奇怪的字符串

时间:2017-10-06 08:38:07

标签: python xml lxml

我正在编写程序来处理xml文件并进行更改。但是当我试图接触它的任何部分时,我得到一些额外的部分。

我的xml文件:

<?xml version="1.0" encoding="UTF-8"?>
<Package xmlns="http://soap.sforce.com/2006/04/metadata">
    <types>
        <members>sbaa__ApprovalChain__c.ExternalID__c</members>
        <members>sbaa__ApprovalCondition__c.ExternalID__c</members>
        <members>sbaa__ApprovalRule__c.ExternalID__c</members>
       <name>CustomField</name>
    </types>
    <version>40.0</version>
</Package>

我有我的代码:

from lxml import etree
import sys

tree = etree.parse('package.xml')
root = tree.getroot()
print( root[0][0].tag )

作为输出,我希望看到成员,但我得到这样的东西:

{http://soap.sforce.com/2006/04/metadata}members

为什么我会看到该网址以及如何阻止它显示?

1 个答案:

答案 0 :(得分:1)

您已定义默认命名空间(Wikipedialxml tutorial)。定义时,它是每个子标记的一部分。

如果你想打印没有命名空间的标签,那很容易

tag = root[0][0].tag
print(tag[tag.find('}')+1:])

如果要从XML中删除命名空间,请参阅this question