我正在尝试分析一些数据,为此,我通过编写一些由其他CSV文件组成的行来创建新的CSV文件。我已经从一个文件(oldfile1
)中提取了数据,所以它是一个列表(具有我要用来附加到新文件的特定索引),而另一个(oldfile2
)我是m用于文件的基础,因此我可以直接添加该文件中的行,因为它们不需要过滤。新行的公式应为row from oldfile2 + row from oldfile1
。 first
打算跳过注释行。但是,此代码当前会创建一个非常大的输出文件(200MB),我怀疑它在每行中循环多次,从而重复了写入的行。但是,我不能立即想到另一种方法来确保oldfile2中的行循环通过,同时又不重复写入的行。我也无法提供更多有关输出文件的详细信息,因为每当我尝试打开它时,它就会崩溃。任何帮助表示赞赏。
with open('newfile.csv','w+') as f:
reader = csv.reader(open('oldfile2.csv'), delimiter=',')
writer = csv.writer(f, delimiter=',')
first = next(reader)
for oldrow2 in reader:
outline = [oldrow2 + oldfile1[i] for i in oldfile1_indices]
writer.writerow(outline)```
答案 0 :(得分:1)
我无法对其进行测试,但我认为您需要zip()
创建对(oldrow2, i)
,然后创建新行并保存
oldfile1 = list(csv.reader(open('oldfile1.csv'), delimiter=','))
oldfile1_indices = [...]
with open('newfile.csv','w+') as f:
writer = csv.writer(f, delimiter=',')
reader2 = csv.reader(open('oldfile2.csv'), delimiter=',')
next(reader2)
for oldrow2, i in zip(reader2, oldfile1_indices):
outline = [oldrow2 + oldfile1[i]]
writer.writerow(outline)