我需要一个python脚本来从xml文件中提取数据
我有一个xml文件,如下图所示:
<software>
<name>Update Image</name>
<Build>22.02</Build>
<description>Firmware for Delta-M Series </description>
<CommonImages> </CommonImages>
<ModelBasedImages>
<ULT>
<CNTRL_0>
<file type="UI_APP" ver="2.35" crc="1234"/>
<file type="MainFW" ver="5.01" crc="5678"/>
<SIZE300>
<file type="ParamTableDB" ver="1.1.4" crc="9101"/>
</SIZE300>
</CNTRL_0>
<CNTRL_2>
<file type="UI_APP" ver="2.35" crc="1234"/>
<file type="MainFW" ver="5.01" crc="9158"/>
</CNTRL_2>
</ULT>
</ModelBasedImages>
</software>
我希望表格格式的数据如下:
输入ver crc
UI_APP 2.35 1234
MainFW 5.01 5678
ParamTableDB 1.1.4 9101
UI_APP 2.35 1234
MainFW 5.01 9158
提取到任何类型的文件csv / doc ....
我试过这段代码:
import xml.etree.ElementTree as ET
import csv
tree = ET.parse("Build_40.01 (copy).xml")
root = tree.getroot()
# open a file for writing
Resident_data = open('ResidentData.csv', 'w')
# create the csv writer object
csvwriter = csv.writer(Resident_data)
resident_head = []
count = 0
for member in root.findall('file'):
resident = []
address_list = []
if count == 0:
name = member.find('type').tag
resident_head.append(name)
ver = member.find('ver').tag
resident_head.append(ver)
crc = member.find('crc').tag
resident_head.append(crc)
csvwriter.writerow(resident_head)
count = count + 1
name = member.find('type').text
resident.append(name)
ver = member.find('ver').text
resident.append(ver)
crc = member.find('crc').text
resident.append(crc)
csvwriter.writerow(resident)
Resident_data.close()
提前致谢 编辑:更新了xml代码。
答案 0 :(得分:1)
使用xpath表达式.//file
查找XML文档中的所有<file>
元素,然后使用每个元素的属性通过csv.DictWriter
填充CSV文件:< / p>
import csv
import xml.etree.ElementTree as ET
tree = ET.parse("Build_40.01 (copy).xml")
root = tree.getroot()
with open('ResidentData.csv', 'w') as f:
w = csv.DictWriter(f, fieldnames=('type', 'ver', 'crc'))
w.writerheader()
w.writerows(e.attrib for e in root.findall('.//file'))
对于您的样本输入,输出CSV文件将如下所示:
type,ver,crc UI_APP,2.35,1234 MainFW,5.01,5678 ParamTableDB,1.1.4,9101 UI_APP,2.35,1234 MainFW,5.01,9158
使用CSV文件的默认分隔符(逗号)。您可以使用delimiter=' '
选项更改分隔符DictWriter()
,但是,您将无法获得与示例输出相同的格式,该输出似乎使用固定宽度字段(但您可能会离开使用tab作为分隔符。)