根据存储在csv中的路径和文本值有效地更新XML文本内容

时间:2015-07-09 05:23:03

标签: python xml csv

我有一个csv文件(csvlist.csv),其中包含我需要在第一列中更改的XML元素的路径。我需要更改原始节点值的文本在病房的第2 - 10,000列中给出。

Path                                                            Edit1       Edit2       Edit3       Edit4       Edit5          ----  Edit1000
".//data/country[@name="Singapore"]/gdpnp[@month="08"]/state",  5.2e-015,   2e-05,      8e-06,      9e-04,      0.4e-05,   
".//data/country[@name="Peru"]/gdppc[@month="06"]/region",      0.04,       0.02,       0.15,       3.24,       0.98,                                                 

我想基于第1列中的路径,通过每个后续列中的值和相应的名称来替换原始XML文件(NoEdit.xml)的元素的文本,例如,基于第2列值的XML将命名为Edit2.xml。

import csv
import xml.etree.ElementTree as ET
tree = ET.parse('NoEdit.xml')      
with open('csvlist.csv', 'rb') as csvlist:
    reader = csv.reader(csvlist, delimiter=',')
for x in range(1, 1000):
    for row in reader:
        if reader.line_num == 1: continue # skip the row of headers
        for data in tree.findall(row[0]):
            data.text = row[(x)]
            tree.write('Edit(x).xml')

根据此论坛q1 q2的帮助,我已经得到了这个@下面的代码。我收到错误:

KeyError: '".//data/country[@name="'

当我给出一个固定路径来删除此错误时,我仍然会在findall上收到错误,或者我没有找到正确的xml。

我将不胜感激任何有关方向的帮助。请随意提出替代方法。谢谢

1 个答案:

答案 0 :(得分:1)

首先,您应提供可重现的示例,以帮助其他用户为您提供帮助。我已经完成了一些工作,我创建了一个测试csv文件,如:

Path,                                             Edit1,       Edit2
".//first",  5.2e-015,   2e-05
".//second",      0.04,       0.02

请注意,我在标题中添加了逗号,因为您错过了它们,我不知道它是故意的还是输入错误。

我还创建了一个小xml文件:

<root>
    <first>1</first>
    <second>2</second>
    <third>3</third>
</root>

脚本:

import csv
from lxml import etree
import sys

xmldata = open(sys.argv[2], newline='').read();

with open(sys.argv[1], newline='') as csvfile:
    for i, pivoted_row in enumerate(zip(*csv.reader(csvfile, delimiter=','))):
        if i == 0:
            xpaths = pivoted_row
            continue
        pivoted_row = [c.strip() for c in pivoted_row]
        tree = etree.fromstring(xmldata)
        with open(pivoted_row[0] + ".xml", 'wb') as outfile:
            for j in range(1, len(xpaths)):
                tree.xpath(xpaths[j])[0].text = pivoted_row[j]
            outfile.write(etree.tostring(tree))

关键部分是转动csv,这样我就可以处理所有数据,一次写入同一个文件。所以这样第一列(xpaths)将是第一行,所以我将它们保存在一个变量中,该变量遍历每一行。

像以下一样运行:

python3 script.py csvfile xmlfile

它会创建两个文件Edit1.xmlEdit2.xml,其中包含以下内容:

==> Edit1.xml <==
<root>
    <first>5.2e-015</first>
    <second>0.04</second>
    <third>3</third>
</root>
==> Edit2.xml <==
<root>
    <first>2e-05</first>
    <second>0.02</second>
    <third>3</third>
</root>

我希望它能够帮助您解决问题。