我在一个文件夹中有251个CSV文件。它们被命名为“返回UDT 1-12-13.csv”,“返回UDT 1-13-13.csv。但是日期不是连续的。例如假期和周末可能缺少日期,所以下一个文件可能是“返回UDT 1-17-13.csv”。每个文件都有一列数据。我需要提取每一列并在一个新的输出csv文件中追加到一列。我想编写一个python脚本来执行此操作。一个带有3个虚拟csv文件的虚拟文件夹(csv1.csv,csv2.csv和csv3.csv)我创建了以下有效的脚本:
import csv, os, sys
out_csv = r"C:\OutCSV\csvtest.csv"
path = r"C:\CSV_test"
fout=open(out_csv,"a")
# first file:
for line in open(path + "\csv1.csv"):
fout.write(line)
# now the rest:
for num in range(2,4):
f = open(path + "\csv"+str(num)+".csv")
f.next() # skip the header
for line in f:
fout.write(line)
f.close() # dont know if needed
fout.close()
问题是文件名中的日期以及如何处理它。任何帮助将不胜感激。