Python etree lxml从父母那里移动一个孩子

时间:2015-02-18 17:02:03

标签: lxml

我有以下形式的xml:

<b>
    <a>
        <c>some stuff</c>
        <d> some more stuff</d>
    </a>
</b>

我想重新格式化为:

<b>
    <c>some stuff</c>
    <a>
        <d> some more stuff</d>
    </a>
</b>

有关如何使用Python lxml执行此操作的任何想法?

1 个答案:

答案 0 :(得分:1)

所以我最终使用虚拟标签和addnext参数解决了它:

def new_a(xml):
    node_b=xml.xpath('/b')[0]
    node_d=xml.xpath('/b/a/d')
    node_d[0].addnext(etree.Element('dummy_tag'))
    node_dummy=xml.xpath('/b/a/dummy_tag')
    node_dummy[0].append(node_d[0])
    etree.strip_tags(node_b,'a')
    dummies=node_b.findall('dummy_tag')
    for node in dummies:
        node.tag='a'
    return xml

所以如果:

xml_ini="<b><a><c>some stuff</c><d>some other stuff</d><e>even more stuff</e></a></b>"

xml=etree.fromstring(xml_ini)

xml_new=new_a(xml)

然后我们离开这个:

<b>
    <a>
        <c>some stuff</c>
        <d>some other stuff</d>
        <e>even more stuff</e>
    </a>
</b>

对此:

<b>
    <c>some stuff</c>
    <a>
        <d>some other stuff</d>
   </a>
    <e>even more stuff</e>
</b>