我有数百个CSV文件,所有文件的日期时间都在同一列(名称未建立索引的位置)中。当我在Excel中以CSV格式打开它们时,所有单元格都显示一个时间(mm:ss.f),但是突出显示该单元格,我可以看到它们具有完整的日期时间。
我使用Pandas组合了几百个这样的文件(并删除重复项并丢弃空字符串):
files = glob.glob("in(*).csv")
df = pd.concat((pd.read_csv(f, header = 0) for f in files))
df.drop_duplicates()
df['accountno'].replace('', np.nan, inplace=True)
df.dropna(subset=['accountno'], inplace=True)
df.to_csv("out.csv")
但是输出文件不再具有完整的日期时间,而仅包含格式化为在excel中显示的时间。
我可以手动输入格式并更改格式,这会导致日期被传输到输出文件,但是多次执行此操作数百次似乎有点乏味...
在将文件读入python时,是否可以访问日期而不是仅显示时间?还是以编程方式将所有文件的格式更改为日期而不是时间的方法?
编辑:我确实尝试在pd.read_csv()函数中添加一个parse_dates=['saledt']
参数,但它抛出了ValueError: 'saledt' is not in list
错误