Question

我在一个文件夹中有251个CSV文件。它们被命名为“返回UDT 1-12-13.csv”，“返回UDT 1-13-13.csv。但是日期不是连续的。例如假期和周末可能缺少日期，所以下一个文件可能是“返回UDT 1-17-13.csv”。每个文件都有一列数据。我需要提取每一列并在一个新的输出csv文件中追加到一列。我想编写一个python脚本来执行此操作。一个带有3个虚拟csv文件的虚拟文件夹（csv1.csv，csv2.csv和csv3.csv）我创建了以下有效的脚本：

 import csv, os, sys

out_csv = r"C:\OutCSV\csvtest.csv"
path = r"C:\CSV_test"


fout=open(out_csv,"a")
# first file:
for line in open(path + "\csv1.csv"):
    fout.write(line)
# now the rest:    
for num in range(2,4):
    f = open(path + "\csv"+str(num)+".csv")
    f.next() # skip the header
    for line in f:
         fout.write(line)
    f.close() # dont know if needed
fout.close()

问题是文件名中的日期以及如何处理它。任何帮助将不胜感激。

循环遍历多个csv文件并将一列写入新的输出csv

0 个答案: