使用objectify
库的lxml
API为元素设置值,默认情况下会将自动检测到的pytype
分配给该元素和所需的命名空间。
例如,设置根元素:
root = objectify.Element('root')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
输出:
<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE"/>
或将值设置为子元素:
child = objectify.SubElement(root, 'child')
root.child = 'value'
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
输出:
<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE">
<child py:pytype="str">value</child>
</root>
甚至使用ObjectPath的setattr:
path = objectify.ObjectPath('root.vader.son')
path.setattr(root, 'Luke')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
输出:
<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE">
<child py:pytype="str">value</child>
<vader>
<son py:pytype="str">Luke</son>
</vader>
</root>
有些解决方案使用pytype
函数(例如When using lxml, can the XML be rendered without namespace attributes?,Remove "xmlns:py..." with lxml.objectify)删除元素创建后的deannotate()
及其命名空间。没有任何解决方案可以从头开始创建没有pytype
及其名称空间的元素。关于如何做到的任何想法?
答案 0 :(得分:2)
在lxml.objectify
中,有两种元素:由Element
工厂创建的树元素和由DataElement
工厂或特定数据类创建的数据元素,例如StringElement
,IntElement
(有关详细信息,请参阅here)。解决方案可能是清空命名空间和特定元素的_pytype
参数,方法是将其分配给空字符串,并且永远不要使用文字的直接赋值。要从文字创建元素,您必须使用DataElement工厂。请注意,如果您有任何特定的命名空间,则必须将命名空间映射而不是空字符串分配给nsmap参数。但是有一个问题。如果要创建树元素,将nsmap
和_pytype
设置为空字符串,则不会删除名称空间和pytype。我不知道为什么。因此,此解决方案仅适用于数据元素。
这是您尝试构建的树的代码:
root = objectify.Element('root', nsmap='', _pytype='')
# sub elements do not need nsmap or _pytype to be emptied
child = objectify.SubElement(root, 'child')
root.child = objectify.DataElement('value', nsmap='', _pytype='')
path = objectify.ObjectPath('root.vader.son')
path.setattr(root, objectify.DataElement('Luke', nsmap='', _pytype=''))
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
哪个输出:
<root xmlns:py="http://codespeak.net/lxml/objectify/pytype" py:pytype="">
<child>value</child>
<vader>
<son>Luke</son>
</vader>
</root>
不是我们想要的!
解决方案在于解决方法,使用ElementMaker
工厂。
# Create your ElementMaker factory, without annotations.
E = objectify.ElementMaker(annotate=False)
# If you have any namespaces you want to use, assign them to the nsmap
# parameter and assign the default namespace to the namespace parameter.
# E = objectify.ElementMaker(annotate=False, namespace=namespace, nsmap=nsmap)
root = E.root()
print(etree.tostring(root, pretty_print=True))
输出:
<root/>
已经解决了引入树元素的名称空间和pytype问题。现在我们可以分配子元素或数据元素:
objectify.SubElement(root, 'child')
root.child = objectify.DataElement('value', nsmap='', _pytype='')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
输出:
<root>
<child>value</child>
</root>
使用setattr()
方法的示例是:
root = E.root()
path = objectify.ObjectPath('root.vader.son')
path.setattr(root, objectify.DataElement('Luke', nsmap='', _pytype=''))
# mysteriously, the below line works the same as the above line:
# path.setattr(root, E.whatevername('Luke'))
print(etree.tostring(root, pretty_print=True).decode('utf-8'))
其输出为:
<root>
<vader>
<son>Luke</son>
</vader>
</root>
答案 1 :(得分:0)
另一种解决方法可能会对您有所帮助: 在设置元素时,您可以使用 _setText 方法: vader.son._setText('卢克')