我有以下形式的xml:
<b>
<a>
<c>some stuff</c>
<d> some more stuff</d>
</a>
</b>
我想重新格式化为:
<b>
<c>some stuff</c>
<a>
<d> some more stuff</d>
</a>
</b>
有关如何使用Python lxml执行此操作的任何想法?
答案 0 :(得分:1)
所以我最终使用虚拟标签和addnext参数解决了它:
def new_a(xml):
node_b=xml.xpath('/b')[0]
node_d=xml.xpath('/b/a/d')
node_d[0].addnext(etree.Element('dummy_tag'))
node_dummy=xml.xpath('/b/a/dummy_tag')
node_dummy[0].append(node_d[0])
etree.strip_tags(node_b,'a')
dummies=node_b.findall('dummy_tag')
for node in dummies:
node.tag='a'
return xml
所以如果:
xml_ini="<b><a><c>some stuff</c><d>some other stuff</d><e>even more stuff</e></a></b>"
xml=etree.fromstring(xml_ini)
xml_new=new_a(xml)
然后我们离开这个:
<b>
<a>
<c>some stuff</c>
<d>some other stuff</d>
<e>even more stuff</e>
</a>
</b>
对此:
<b>
<c>some stuff</c>
<a>
<d>some other stuff</d>
</a>
<e>even more stuff</e>
</b>