为什么我在追加或连接后在pandas数据帧上得到不同的大小?

时间:2016-05-16 21:12:20

标签: python pandas dataframe append concat

我的代码如下所示:

import pandas as pd

candle_data = pd.DataFrame()

for fileName in files:
    csv_data = pd.read_csv(fileName, header=None)
    candle_data = pd.concat([candle_data, csv_data])
    #candle_data = candle_data.append(csv_data)  

print(candle_data)
print(candle_data.tail(3))

结果是:

                0      1        2        3        4        5  6
0      2000.05.30  17:27  0.93020  0.93020  0.93020  0.93020  0
1      2000.05.30  17:35  0.93040  0.93050  0.93040  0.93050  0
2      2000.05.30  17:38  0.93040  0.93040  0.93030  0.93030  0
...
29781  2016.04.29  16:55  1.14512  1.14524  1.14503  1.14515  0
29782  2016.04.29  16:56  1.14515  1.14517  1.14491  1.14495  0
29783  2016.04.29  16:57  1.14494  1.14505  1.14482  1.14482  0
29784  2016.04.29  16:58  1.14477  1.14511  1.14457  1.14457  0

[5171932 rows x 7 columns]
                0      1        2        3        4        5  6
29782  2016.04.29  16:56  1.14515  1.14517  1.14491  1.14495  0
29783  2016.04.29  16:57  1.14494  1.14505  1.14482  1.14482  0
29784  2016.04.29  16:58  1.14477  1.14511  1.14457  1.14457  0

为什么在打印整个数据帧时将5171932x7作为维度,但最后一行索引是29784? 合并两个数据帧的所有行的正确方法是什么?

1 个答案:

答案 0 :(得分:3)

我认为duplicates中有index

如果没有有意义的索引,您可以将参数ignore_index=True添加到concat

pd.concat([candle_data, csv_data], ignore_index=True)

Docs