设置没有pytype的值 - lxml objectify

时间:2018-03-25 17:40:10

标签: python lxml lxml.objectify

使用objectify库的lxml API为元素设置值,默认情况下会将自动检测到的pytype分配给该元素和所需的命名空间。

例如,设置根元素:

root = objectify.Element('root')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

输出:

<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE"/>

或将值设置为子元素:

child = objectify.SubElement(root, 'child')
root.child = 'value'
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

输出:

<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE">
  <child py:pytype="str">value</child>
</root>

甚至使用ObjectPath的setattr:

path = objectify.ObjectPath('root.vader.son')
path.setattr(root, 'Luke')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

输出:

<root xmlns:py="http://codespeak.net/lxml/objectify/pytype"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" py:pytype="TREE">
  <child py:pytype="str">value</child>
  <vader>
    <son py:pytype="str">Luke</son>
  </vader>
</root>

有些解决方案使用pytype函数(例如When using lxml, can the XML be rendered without namespace attributes?Remove "xmlns:py..." with lxml.objectify)删除元素创建后的deannotate()及其命名空间。没有任何解决方案可以从头开始创建没有pytype及其名称空间的元素。关于如何做到的任何想法?

2 个答案:

答案 0 :(得分:2)

lxml.objectify中,有两种元素:由Element工厂创建的树元素和由DataElement工厂或特定数据类创建的数据元素,例如StringElementIntElement(有关详细信息,请参阅here)。解决方案可能是清空命名空间和特定元素的_pytype参数,方法是将其分配给空字符串,并且永远不要使用文字的直接赋值。要从文字创建元素,您必须使用DataElement工厂。请注意,如果您有任何特定的命名空间,则必须将命名空间映射而不是空字符串分配给nsmap参数。但是有一个问题。如果要创建树元素,将nsmap_pytype设置为空字符串,则不会删除名称空间和pytype。我不知道为什么。因此,此解决方案仅适用于数据元素。

这是您尝试构建的树的代码:

root = objectify.Element('root', nsmap='', _pytype='')
# sub elements do not need nsmap or _pytype to be emptied
child = objectify.SubElement(root, 'child')
root.child = objectify.DataElement('value', nsmap='', _pytype='')
path = objectify.ObjectPath('root.vader.son')
path.setattr(root, objectify.DataElement('Luke', nsmap='', _pytype=''))
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

哪个输出:

<root xmlns:py="http://codespeak.net/lxml/objectify/pytype" py:pytype="">
  <child>value</child>
  <vader>
    <son>Luke</son>
  </vader>
</root>

不是我们想要的!

解决方案在于解决方法,使用ElementMaker工厂。

# Create your ElementMaker factory, without annotations.
E = objectify.ElementMaker(annotate=False)
# If you have any namespaces you want to use, assign them to the nsmap
# parameter and assign the default namespace to the namespace parameter.
# E = objectify.ElementMaker(annotate=False, namespace=namespace, nsmap=nsmap)
root = E.root()
print(etree.tostring(root, pretty_print=True))

输出:

<root/>

已经解决了引入树元素的名称空间和pytype问题。现在我们可以分配子元素或数据元素:

objectify.SubElement(root, 'child')
root.child = objectify.DataElement('value', nsmap='', _pytype='')
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

输出:

<root>
  <child>value</child>
</root>

使用setattr()方法的示例是:

root = E.root()
path = objectify.ObjectPath('root.vader.son')
path.setattr(root, objectify.DataElement('Luke', nsmap='', _pytype=''))
# mysteriously, the below line works the same as the above line:
# path.setattr(root, E.whatevername('Luke'))
print(etree.tostring(root, pretty_print=True).decode('utf-8'))

其输出为:

<root>
  <vader>
    <son>Luke</son>
  </vader>
</root>

答案 1 :(得分:0)

另一种解决方法可能会对您有所帮助: 在设置元素时,您可以使用 _setText 方法: vader.son._setText('卢克')