我有一个XML文件(gt.xml
),如下所示:
<annotation>
<object>
<name>class1</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>805</xmin>
<ymin>140</ymin>
<xmax>975</xmax>
<ymax>300</ymax>
</bndbox>
</object>
<object>
<name>class2</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>816</xmin>
<ymin>386</ymin>
<xmax>1000</xmax>
<ymax>575</ymax>
</bndbox>
</object>
</annotation>
我有一个包含新信息的对象:
objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]
我想将与bbox
对应的name
的值更新为XML文件。因此,gt.xml
XML文件中的预期新信息将是:
<annotation>
<object>
<name>class1</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>813</xmin>
<ymin>141</ymin>
<xmax>964</xmax>
<ymax>296</ymax>
</bndbox>
</object>
<object>
<name>class2</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>824</xmin>
<ymin>389</ymin>
<xmax>989</xmax>
<ymax>568</ymax>
</bndbox>
</object>
</annotation>
这是我的更新功能:
def update_xml(filename, object):
""" Parse a PASCAL VOC xml file """
xml_file = os.path.join(dst_xml_dir, filename)
tree = ET.parse(xml_file)
print (len(object))
for obj in tree.findall('object'):
for obj_rotate in range(len(object)):
print (object[obj_rotate]['bbox'])
if(obj.find('name').text == object[obj_rotate]['name']):
bbox=object[obj_rotate]['bbox']
obj.find('bndbox').find('xmin').text= str(bbox[0])
obj.find('bndbox').find('ymin').text = str(bbox[1])
obj.find('bndbox').find('xmax').text= str(bbox[2])
obj.find('bndbox').find('ymax').text = str(bbox[3])
tree.write(xml_file)
它可以更新XML但是它有一些问题我必须使用两个循环来在条件if
中插入类名。我想我们可以有更好的方法来使用objects
信息中的单个循环。我们可以用Python做到吗?
答案 0 :(得分:1)
我的方法是首先提出修改后的dict
-
objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]
objects_an = { obj['name']:obj['bbox'] for obj in objects }
这会给 -
{'class2': [824, 389, 989, 568], 'class1': [813, 141, 964, 296]}
那就是它,它现在只是遍历。这是完整的代码 -
objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]
objects_an = { obj['name']:obj['bbox'] for obj in objects }
print(objects_an)
from xml import etree
e = etree.ElementTree.parse('gt.xml')
root = e.getroot()
obj_xml = root.findall('object')
for obj in obj_xml:
name = obj.find('name')
bbox_mod = objects_an[name.text] # do a try catch here
bbox_original = obj.find('bndbox')
bbox_original.find('xmin').text = str(bbox_mod[0])
bbox_original.find('ymin').text = str(bbox_mod[1])
bbox_original.find('xmax').text = str(bbox_mod[2])
bbox_original.find('ymax').text = str(bbox_mod[3])
e.write('gt2.xml')
你可以将它包装在一个函数中,它应该可以解决问题。希望这有帮助!
答案 1 :(得分:0)
您可以使用xmltodict
库。
$pip install xmltodict
import json
import xmltodict
xml = '''
<annotation>
<object>
<name>class1</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>805</xmin>
<ymin>140</ymin>
<xmax>975</xmax>
<ymax>300</ymax>
</bndbox>
</object>
<object>
<name>class2</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>816</xmin>
<ymin>386</ymin>
<xmax>1000</xmax>
<ymax>575</ymax>
</bndbox>
</object>
</annotation>
'''
d = xmltodict.parse(xml)
objects = [{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]
for x in objects:
for y in d['annotation']['object']:
if x['name'] == y['name']:
y['bndbox']['xmin'] = x['bbox'][0]
y['bndbox']['ymin'] = x['bbox'][1]
y['bndbox']['xmax'] = x['bbox'][2]
y['bndbox']['ymax'] = x['bbox'][3]
print(xmltodict.unparse(d, pretty=True))
输出:
<?xml version="1.0" encoding="utf-8"?>
<annotation>
<object>
<name>class1</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>813</xmin>
<ymin>141</ymin>
<xmax>964</xmax>
<ymax>296</ymax>
</bndbox>
</object>
<object>
<name>class2</name>
<pose>Unspecified</pose>
<bndbox>
<xmin>824</xmin>
<ymin>389</ymin>
<xmax>989</xmax>
<ymax>568</ymax>
</bndbox>
</object>
</annotation>