如何编写结合其他2个CSV行的CSV文件(Python)

时间:2019-04-18 00:52:43

标签: python file csv file-handling

我正在尝试分析一些数据,为此,我通过编写一些由其他CSV文件组成的行来创建新的CSV文件。我已经从一个文件(oldfile1)中提取了数据,所以它是一个列表(具有我要用来附加到新文件的特定索引),而另一个(oldfile2)我是m用于文件的基础,因此我可以直接添加该文件中的行,因为它们不需要过滤。新行的公式应为row from oldfile2 + row from oldfile1first打算跳过注释行。但是,此代码当前会创建一个非常大的输出文件(200MB),我怀疑它在每行中循环多次,从而重复了写入的行。但是,我不能立即想到另一种方法来确保oldfile2中的行循环通过,同时又不重复写入的行。我也无法提供更多有关输出文件的详细信息,因为每当我尝试打开它时,它就会崩溃。任何帮助表示赞赏。

with open('newfile.csv','w+') as f:
        reader = csv.reader(open('oldfile2.csv'), delimiter=',')
        writer = csv.writer(f, delimiter=',')
        first = next(reader)
        for oldrow2 in reader:
                outline = [oldrow2 + oldfile1[i] for i in oldfile1_indices]
                writer.writerow(outline)```


1 个答案:

答案 0 :(得分:1)

我无法对其进行测试,但我认为您需要zip()创建对(oldrow2, i),然后创建新行并保存

oldfile1 = list(csv.reader(open('oldfile1.csv'), delimiter=','))
oldfile1_indices = [...]

with open('newfile.csv','w+') as f:
    writer = csv.writer(f, delimiter=',')

    reader2 = csv.reader(open('oldfile2.csv'), delimiter=',')
    next(reader2)

    for oldrow2, i in zip(reader2, oldfile1_indices):
        outline = [oldrow2 + oldfile1[i]]
        writer.writerow(outline)