pandas如何计算索引?

时间:2016-07-08 14:36:37

标签: python pandas indexing time-series

我想在csv的数据框中包含时间序列数据。我使用以下程序:

path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)

data_df.head()

head

结果如下:

data_df.info()

indexes

索引(1到187481)与行数(5387507)有什么不同?

data_df.reset_index()
事情变得正常:

indexes corrected

那么如何计算初始指数?

1 个答案:

答案 0 :(得分:2)

indexes中有重复项,因为index的每个DataFrame都来自0函数中的concat

正如MaxU所述,解决方案是将参数ignore_index=True添加到concat - docs

data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path, ignore_index=True)