参考这个问题:Python: In an xml, How to delete nodes within a parent node
任何人都可以解释一下我为什么在我的python脚本中遇到这个问题。
Value Error : list.remove(x): x not in list
以下代码。
import xml.etree.cElementTree as ET
try:
tree = ET.parse('Test.xml')
root = tree.getroot()
keeper_data = ['06354237', '87654321']
instances = root.findall('./Replication/Instance')
for instance in instances:
data = instance.find('./DataSet/Data')
if data.text not in keeper_data:
root.remove(instance)
tree.write('New.xml')
except ValueError as err:
print ('Value Error : ' + str(err))
下面的xml示例。请注意,xml结构与上一个问题的唯一区别是添加了“复制”标记,该标记包含所有标记。
<?xml version='1.0' encoding='UTF-8'?>
<Root>
<Identification>
<Description ID="12">Some text</Description>
</Identification>
<Symbols>
<Name Width="1">abc</Name>
<Name Width="2">def</Name>
</Symbols>
<Replication iRowRef="884">
<Instance RowRef="A">
<DataSet>
<Data>12345678</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
</Instance>
<Instance RowRef="B">
<DataSet>
<Data>87654321</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
</Instance>
<Instance RowRef="C">
<DataSet>
<Data>06354237</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
<DataSet>
<Data>abcd</Data>
</DataSet>
</Instance>
</Replication>
</Root>
答案 0 :(得分:2)
您需要使用直接父节点,而不是根节点才能使用Element.remove
。
我在这里使用了lxml
,因为ElementTree没有提供获取父节点的方法。
import lxml.etree as ET
tree = ET.parse('Test.xml')
root = tree.getroot()
keeper_data = ['06354237', '87654321']
instances = root.findall('./Replication/Instance')
for instance in instances:
data = instance.find('./DataSet/Data')
if data.text not in keeper_data:
instance.getparent().remove(instance)
...