如何根据文本节点的值添加xml节点

时间:2012-08-13 01:41:06

标签: python xml xpath lxml

我正在玩@ http://www.jsphylosvg.com/examples/source.php?example=2&t=xml

找到的xml文件

如果节点name="Espresso"的值,我想插入一个节点。

E.g。我想改变:

<clade>
<name>Espresso</name>
<branch_length>2.0</branch_length>
</clade>

为:

<clade>
<name>Espresso</name>
<url>www.espresso.com</url>
<branch_length>2.0</branch_length>
</clade>

根据我迄今为止所做的研究,我可以使用xpath来查找包含espresso 的节点(这应该可以,但不是吗?)

import re, sys
import lxml.etree
f = open("test.xml", "r")
data = f.read()
tree = lxml.etree.XML(data)
if tree.xpath('//name/text()="Espresso"'):
    insert new child here

此时,应该可以使用use lxml.etree.Element来创建xml节点,并使用insert将它们附加到xml文档中

然而,虽然这在理论上听起来很棒,但我无法让它发挥作用 我非常感谢任何帮助/建议

1 个答案:

答案 0 :(得分:3)

你的XPath声明并不完全正确。这就是我想你想要的:

>>> DOC = """<clade>
... <name>Espresso</name>
... <branch_length>2.0</branch_length>
... </clade>"""
>>> 
>>> import lxml.etree
>>> tree = lxml.etree.XML(DOC)
>>> matches = tree.xpath('//name[text()="Espresso"]')

然后在匹配后附加元素:

>>> for e in matches:
...    sibling = lxml.etree.Element("url")
...    sibling.text = "www.espresso.com"
...    e.addnext(sibling)

>>> print lxml.etree.tostring(tree)
<clade>
<name>Espresso</name><url>www.espresso.com</url>
<branch_length>2.0</branch_length>
</clade>

修改

由于您的文档具有命名空间,因此您希望将命名空间映射传递给XPath函数,并在标记名称前加上命名空间前缀,如下所示:

>>> nsmap = {'phylo': 'http://www.phyloxml.org'}
>>> tree.xpath('//phylo:name[text()="Espresso"]', namespaces=nsmap)
[<Element {http://www.phyloxml.org}name at 0x2c875f0>]