如何更新XML中的对象信息?

时间:2017-11-24 04:14:19

标签: python xml python-2.7

我有一个XML文件(gt.xml),如下所示:

<annotation>
    <object>
        <name>class1</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>805</xmin>
            <ymin>140</ymin>
            <xmax>975</xmax>
            <ymax>300</ymax>
        </bndbox>
    </object>
    <object>
        <name>class2</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>816</xmin>
            <ymin>386</ymin>
            <xmax>1000</xmax>
            <ymax>575</ymax>
        </bndbox>
    </object>
</annotation>

我有一个包含新信息的对象:

objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]

我想将与bbox对应的name的值更新为XML文件。因此,gt.xml XML文件中的预期新信息将是:

<annotation>
    <object>
        <name>class1</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>813</xmin> 
            <ymin>141</ymin>
            <xmax>964</xmax>
            <ymax>296</ymax>
        </bndbox>
    </object>
    <object>
        <name>class2</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>824</xmin> 
            <ymin>389</ymin>
            <xmax>989</xmax>
            <ymax>568</ymax>
        </bndbox>
    </object>
</annotation>

这是我的更新功能:

def update_xml(filename, object):
  """ Parse a PASCAL VOC xml file """
  xml_file = os.path.join(dst_xml_dir, filename)
  tree = ET.parse(xml_file)
  print (len(object))
  for obj in tree.findall('object'):
      for obj_rotate in range(len(object)):
          print (object[obj_rotate]['bbox'])
          if(obj.find('name').text == object[obj_rotate]['name']):
              bbox=object[obj_rotate]['bbox']
              obj.find('bndbox').find('xmin').text= str(bbox[0])
              obj.find('bndbox').find('ymin').text = str(bbox[1])
              obj.find('bndbox').find('xmax').text= str(bbox[2])
              obj.find('bndbox').find('ymax').text = str(bbox[3])
  tree.write(xml_file)

它可以更新XML但是它有一些问题我必须使用两个循环来在条件if中插入类名。我想我们可以有更好的方法来使用objects信息中的单个循环。我们可以用Python做到吗?

2 个答案:

答案 0 :(得分:1)

我的方法是首先提出修改后的dict -

objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]

objects_an = { obj['name']:obj['bbox'] for obj in objects }

这会给 -

{'class2': [824, 389, 989, 568], 'class1': [813, 141, 964, 296]}

那就是它,它现在只是遍历。这是完整的代码 -

objects=[{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]

objects_an = { obj['name']:obj['bbox'] for obj in objects }
print(objects_an)

from xml import etree
e = etree.ElementTree.parse('gt.xml')
root = e.getroot()

obj_xml = root.findall('object')

for obj in obj_xml:
    name = obj.find('name')
    bbox_mod = objects_an[name.text] # do a try catch here

    bbox_original = obj.find('bndbox')
    bbox_original.find('xmin').text = str(bbox_mod[0])
    bbox_original.find('ymin').text = str(bbox_mod[1])
    bbox_original.find('xmax').text = str(bbox_mod[2])
    bbox_original.find('ymax').text = str(bbox_mod[3])

e.write('gt2.xml')

你可以将它包装在一个函数中,它应该可以解决问题。希望这有帮助!

答案 1 :(得分:0)

您可以使用xmltodict库。

$pip install xmltodict

import json
import xmltodict

xml = '''
<annotation>    
    <object>
        <name>class1</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>805</xmin>
            <ymin>140</ymin>
            <xmax>975</xmax>
            <ymax>300</ymax>
        </bndbox>
    </object>
    <object>
        <name>class2</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>816</xmin>
            <ymin>386</ymin>
            <xmax>1000</xmax>
            <ymax>575</ymax>
        </bndbox>
    </object>
</annotation>
'''

d = xmltodict.parse(xml)

objects = [{'name': 'class1', 'bbox': [813, 141, 964, 296]}, {'name': 'class2', 'bbox': [824, 389, 989, 568]}]

for x in objects:
    for y in d['annotation']['object']:
        if x['name'] == y['name']:
            y['bndbox']['xmin'] = x['bbox'][0]
            y['bndbox']['ymin'] = x['bbox'][1]
            y['bndbox']['xmax'] = x['bbox'][2]
            y['bndbox']['ymax'] = x['bbox'][3]

print(xmltodict.unparse(d, pretty=True))

输出:

<?xml version="1.0" encoding="utf-8"?>
<annotation>
    <object>
        <name>class1</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>813</xmin>
            <ymin>141</ymin>
            <xmax>964</xmax>
            <ymax>296</ymax>
        </bndbox>
    </object>
    <object>
        <name>class2</name>
        <pose>Unspecified</pose>
        <bndbox>
            <xmin>824</xmin>
            <ymin>389</ymin>
            <xmax>989</xmax>
            <ymax>568</ymax>
        </bndbox>
    </object>
</annotation>