Question

我想在csv的数据框中包含时间序列数据。我使用以下程序：

path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)

data_df.head()

结果如下：

data_df.info()

索引（1到187481）与行数（5387507）有什么不同？

做

data_df.reset_index()

事情变得正常：

那么如何计算初始指数？

Answer 1

indexes中有重复项，因为index的每个DataFrame都来自0函数中的concat。

正如MaxU所述，解决方案是将参数ignore_index=True添加到concat - docs：

data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path, ignore_index=True)

pandas如何计算索引？

1 个答案: