假设我有一个包含3个图像1,2,3的图像文件夹和一个包含这些图像名称的XML文件。
XML文件如下所示:
<?xml version="1.0" encoding="ISO-8859-1"?>
-<imagelist>
<image tag="self" file="word/1/1.jpg"/>
<image tag="adhesive" file="word/1/2.jpg"/>
<image tag="address" file="word/1/3.jpg"/>
</imagelist>
如何在Python中或特别是在pandas中阅读此内容,以便将图像与XML文件中的图像标记相关联?
答案 0 :(得分:1)
使用minidom
<强>演示:强>
from xml.dom import minidom
xmldoc = minidom.parse(filename)
itemlist = xmldoc.getElementsByTagName('image')
for i in itemlist:
print(i.attributes["file"].value)
<强>输出:强>
word/1/1.jpg
word/1/2.jpg
word/1/3.jpg
答案 1 :(得分:0)
使用ElementTree
。
<强>演示:强>
import xml.etree.ElementTree as ET
dom = ET.parse(xmlfilename)
for element in dom.findall('image'):
print(element.get('file'))
<强>输出:强>
word/1/1.jpg
word/1/2.jpg
word/1/3.jpg