将CSV中的值作为字符串解析为文本文件

时间:2015-07-30 21:44:23

标签: python xml list parsing csv

我正在尝试创建一个txt文件,其中包含dir中的XML文件以及存在标记时每个XML文件中的文本。

我无法使用下面的命令将csv行作为变量读取。我试图以多种方式提取所需的值,但继续遇到砖墙。

以下是代码:

container = raw_input("Choose a filename for your container:")
epub = zipfile.ZipFile( container + ".zip", 'w')
xmlinput = glob.glob('./*.xml')
def xmldrop(dir):
  for r,d,f in os.walk(dir):
     for files in f:
        if files.endswith(".xml"):
            dom=parse(os.path.join(r, files))
            name = dom.getElementsByTagName('title')
            with open('catalog.csv', 'a') as f:
                f.write(files +  "," + name[0].firstChild.nodeValue  + "\n")
xmldrop("./")

line_number = 0
with open('catalog.csv', 'rb') as f:
    mycsv = csv.reader(f)
    mycsv = list(mycsv)
    text = mycsv[line_number+1][1]

list_tpl = '''
<Container>
<FileName>
%(FileName)s
</FileName>
</Container>'''
FileName = ""

for i, xml in enumerate(xmlinput):
    basename = os.path.basename(xml)
    FileName += ('<Fileid="%i" filename="%s"> <title>%s</title> </Fileid>' %
                 (i+1, basename, text))

epub.writestr('list.txt', list_tpl % {
  'FileName': FileName
})

我能够成功将信息拉入csv文件,如此输出所示:

  

file_1.xml,前奏

     

file_2.xml,评估

     

file_3.xml,综述

     

file_4.xml,目录

但生成的list.txt文件如下所示:

<Container>
<FileName>
<Fileid="1" filename="file_1.xml"> <title>Assessment</title></p> </Fileid>
<Fileid="2" filename="file_2.xml"> <title>Assessment</title></p> </Fileid>
<Fileid="3" filename="file_3.xml"> <title>Assessment</title></p> </Fileid>
<Fileid="4" filename="file_4.xml"> <title>Assessment</title></p> </Fileid>
</FileName>
</Container>

所需的输出将是:

<Container>
<FileName>
<Fileid="1" filename="file_1.xml"> <title>Intro</title> </Fileid>
<Fileid="2" filename="file_2.xml"> <title>Assessment</title> </Fileid>
<Fileid="3" filename="file_3.xml"> <title>Review</title> </Fileid>
<Fileid="4" filename="file_4.xml"> <title>Catalog</title> </Fileid>
</FileName>
</Container>

非常感谢任何帮助。我一直试图将两者配对超过一周,但没有成功。

1 个答案:

答案 0 :(得分:1)

在打印xml时,您没有更新文本变量。 你设置一次     text = mycsv [line_number + 1] [1] 但你永远不会再次更新它,所以它不断输出Assesment