Python - 将XML转换为CSV

时间:2017-05-17 05:48:02

标签: xml python-3.x csv

下午好。

我将在这个问题前面说这是我第一次涉足Python。我正在使用API​​返回以下XML示例:

<Times>
    <Time>
        <ID> 120877787 </ID>
        <Job>
            <ID> J000050 </ID>
            <Name> My Job </Name>
        </Job>
        <Task>
            <ID> 59469972 </ID>
            <Name> My Task </Name>
        </Task>
        <Staff>
            <ID> 74268 </ID>
            <Name> My Name </Name>
        </Staff>
        <Date> 2017-05-19T00:00:00 </Date>
        <Minutes> 480 </Minutes>
        <Note/>
        <Billable> true </Billable>
    </Time>
</Times>

我目前正在使用Python 3.4将XML转换为CSV。

我已经做了一些研究(例如http://blog.appliedinformaticsinc.com/how-to-parse-and-convert-xml-to-csv-using-python/)来解决这个问题,但我无法得出一个合适的结果,主要是因为我不能很好地理解语法以适应这是我的确切情况。

基本上我正在寻找以下输出。

Job Name  Task Name  Staff Name  Date                 Minutes Billable
My Job    My Task    My Name     2017-05-19T00:00:00  480     true

根据要求,这是从API返回XML的方式(作为字符串并由print(ts.content)查看),这可能是我出错的地方。

<Times><Time><ID> 120877787 </ID><Job><ID> J000050 </ID><Name> My Job </Name></Job><Task><ID> 59469972 </ID><Name> My Task </Name></Task><Staff><ID>74268</ID><Name> My Name </Name></Staff><Date> 2017-05-19T00:00:00 </Date><Minutes> 480 </Minutes><Note/><Billable> true </Billable></Time></Times>

有人可以提供一些有关处理此任务的最佳方法的见解吗?

感谢您的帮助。

斯科特

1 个答案:

答案 0 :(得分:1)

您可以使用findall功能。

import xml.etree.ElementTree as ET
import csv

tree = ET.parse("/temp/test.xml")
root = tree.getroot()

f = open('/temp/test.csv', 'w')

csvwriter = csv.writer(f)

count = 0

head = ['Job Name','Task Name','Staff Name','Date','Minutes','Billable']

csvwriter.writerow(head)

for time in root.findall('Time'):
    row = []
    job_name = time.find('Job').find('Name').text
    row.append(job_name)
    task_name = time.find('Task').find('Name').text
    row.append(task_name)
    staff_name = time.find('Staff').find('Name').text
    row.append(staff_name)
    date = time.find('Date').text
    row.append(date)
    minutes = time.find('Minutes').text
    row.append(minutes)
    billable = time.find('Billable').text
    row.append(billable)
    csvwriter.writerow(row)
f.close()

给出了:

Job Name,Task Name,Staff Name,Date,                Minutes,Billable
 My Job , My Task , My Name , 2017-05-19T00:00:00 , 480 , true