根据存储在csv中的路径和文本值有效地创建多个XML

时间:2015-07-27 15:53:51

标签: python xml csv

我有一个csv文件,其中包含我需要在第一列中更改的xml文件的XML元素的路径。要创建的每个新xml文件的文本在病房的第2 - 10,000列中给出。

Path                                                            Edit1       Edit2       Edit3       Edit4       Edit5          ----  Edit1000
".//data/country[@name="Singapore"]/gdpnp[@month="08"]/state",  5.2e-015,   2e-05,      8e-06,      9e-04,      0.4e-05,   
".//data/country[@name="Peru"]/gdppc[@month="06"]/region",      0.04,       0.02,       0.15,       3.24,       0.98,                                                 

我想基于第1列中的路径,通过每个后续列中的值和相应的名称来替换原始XML文件(NoEdit.xml)的元素的文本,例如,基于第2列值的XML将命名为Edit2.xml。

import csv
import xml.etree.ElementTree as ET
tree = ET.parse('NoEdit.xml')      
with open('csvlist.csv', 'rb') as csvlist:
    reader = csv.reader(csvlist, delimiter=',')
for x in range(1, 1000):
    for row in reader:
        if reader.line_num == 1: continue # skip the row of headers
        for data in tree.findall(row[0]):
            data.text = row[(x)]
            tree.write('Edit(x).xml')

基于此论坛的帮助q1 q2我已经得到了这个@下面的代码。我收到错误KeyError: '".//data/country[@name="'。当我使用固定路径时,我仍然会在findall上收到错误,或者我没有得到正确的xml。

我将不胜感激任何有关方向的帮助。请随意提出替代方法。

1 个答案:

答案 0 :(得分:1)

这不是有效的CSV:

".//data/country[@name="Singapore"]/gdpnp[@month="08"]/state",

相反,它应该是:

".//data/country[@name=""Singapore""]/gdpnp[@month=""08""]/state",

值得注意的是,数据中的任何文字"都需要加倍到"",以便从结尾引号中消除歧义。 (我很好奇你是如何创建该文件的 - 任何电子表格程序或其他CSV生成器应该都是正确的。)

我还强烈建议您在此使用lxml.etree及其.xpath()电话; .findall()不是真正的XPath。