Question

我正在编写一个脚本，该脚本读取一个文件夹中的一堆csv，重命名一列，然后使用pandas将重命名的列添加到主数据帧中。但是，我遇到的问题是，即使我的几个单独的数据框都超过2000行，pandas仍会切断索引1995的所有内容，还有其他人看到吗？

    col_names = []
    col_lists = []
    newer_df = pd.DataFrame()
    for i in os.listdir("/Users/folder"):
       if i.endswith(".txt"):
            new_df = pd.read_csv("/Users/folder/" + i)
            print i + "   " + str(len(new_df))
            newer_df["XSample"+i]=new_df["XSample"]
            newer_df["YSample"+i]=new_df["YSample"]
    newer_df.to_csv("/Users/folder/master.csv")

但是，尽管我的许多输入内容都超过了1995行，但我的母版纸还是在1995年被剪掉了。

Answer 1

我发送到for循环中的第一个电子表格的长度为1995，此后的每个电子表格都缩减为该长度，我通过在for循环之前创建一个新的列（编号从1到3000）来解决此问题，因此3000是新的索引终止

熊猫切断了1995年指数的数据

1 个答案: