如何将图像文件夹与xml文件与图像的名称相关联?

时间:2018-05-04 13:46:51

标签: python xml pandas xml-parsing

假设我有一个包含3个图像1,2,3的图像文件夹和一个包含这些图像名称的XML文件。

XML文件如下所示:

<?xml version="1.0" encoding="ISO-8859-1"?>
-<imagelist>
  <image tag="self" file="word/1/1.jpg"/>
  <image tag="adhesive" file="word/1/2.jpg"/>
  <image tag="address" file="word/1/3.jpg"/>
</imagelist>

如何在Python中或特别是在pandas中阅读此内容,以便将图像与XML文件中的图像标记相关联?

2 个答案:

答案 0 :(得分:1)

使用minidom

<强>演示:

from xml.dom import minidom
xmldoc = minidom.parse(filename)
itemlist = xmldoc.getElementsByTagName('image')
for i in itemlist:
    print(i.attributes["file"].value)

<强>输出:

word/1/1.jpg
word/1/2.jpg
word/1/3.jpg

答案 1 :(得分:0)

使用ElementTree

<强>演示:

import xml.etree.ElementTree as ET
dom = ET.parse(xmlfilename)
for element in dom.findall('image'):
   print(element.get('file'))

<强>输出:

word/1/1.jpg
word/1/2.jpg
word/1/3.jpg