我正在编写一个脚本,该脚本读取一个文件夹中的一堆csv,重命名一列,然后使用pandas将重命名的列添加到主数据帧中。但是,我遇到的问题是,即使我的几个单独的数据框都超过2000行,pandas仍会切断索引1995的所有内容,还有其他人看到吗?
col_names = []
col_lists = []
newer_df = pd.DataFrame()
for i in os.listdir("/Users/folder"):
if i.endswith(".txt"):
new_df = pd.read_csv("/Users/folder/" + i)
print i + " " + str(len(new_df))
newer_df["XSample"+i]=new_df["XSample"]
newer_df["YSample"+i]=new_df["YSample"]
newer_df.to_csv("/Users/folder/master.csv")
但是,尽管我的许多输入内容都超过了1995行,但我的母版纸还是在1995年被剪掉了。
答案 0 :(得分:0)
我发送到for循环中的第一个电子表格的长度为1995,此后的每个电子表格都缩减为该长度,我通过在for循环之前创建一个新的列(编号从1到3000)来解决此问题,因此3000是新的索引终止