Question

给定具有以下结构的XML文件：

<Root>
    <Stuff></Stuff>
    <MoreStuff></MoreStuff>
    <Targets>
        <Target>
            <ID>12345</ID>
            <Type>Ground</Type>
            <Size>Large</Size>
        </Target>
        <Target>
            ...
        </Target>
    </Targets>
</Root>

我试图遍历<Targets>元素下的每个子项，检查每个<ID>是否有特定值，如果找到该值，那么我想删除整个{ {1}}条目。我一直在使用ElementTree Python库，但收效甚微。这就是我到目前为止所拥有的：

<Target>

我采用这种方法的问题是只删除了import xml.etree.ElementTree as ET tree = ET.parse('file.xml') root = tree.getroot() iterator = root.getiterator('Target') for item in iterator: old = item.find('ID') text = old.text if '12345' in text: item.remove(old) tree.write('out.xml')子元素，但我需要移除整个<ID>元素及其所有子元素。谁能帮忙！感谢。

Answer 1

不幸的是，元素树元素不知道他们的父母是谁。有一种解决方法 - You can build the mapping yourself：

tree = ET.parse('file.xml')
root = tree.getroot()
parent_map = dict((c, p) for p in tree.getiterator() for c in p)

# list so that we don't mess up the order of iteration when removing items.
iterator = list(root.getiterator('Target'))

for item in iterator:
    old = item.find('ID')
    text = old.text
    if '12345' in text:
        parent_map[item].remove(item)
        continue

tree.write('out.xml')

未测试

Answer 2

您需要保留对Targets元素的引用，以便您可以删除其子元素，因此从那里开始迭代。抓住每个目标，检查你的情况并删除你不喜欢的东西。

#!/usr/bin/env python
import xml.etree.ElementTree as ET

xmlstr="""<Root>
    <Stuff></Stuff>
    <MoreStuff></MoreStuff>
    <Targets>
        <Target>
            <ID>12345</ID>
            <Type>Ground</Type>
            <Size>Large</Size>
        </Target>
        <Target>
            ...
        </Target>
    </Targets>
</Root>"""

root = ET.fromstring(xmlstr)

targets = root.find('Targets')

for target in targets.findall('Target'):
    _id = target.find('ID')
    if _id is not None and '12345' in _id.text:
        targets.remove(target)

print ET.tostring(root)

从XML中删除父元素和所有子元素

2 个答案: