连接到DataFrame将提供两个单独的开始索引

时间:2018-06-06 08:05:56

标签: python pandas dataframe

我从两个csv文件中读取了两个数据帧。

train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")

train数据框中,我有 891 行,在test数据框中,我有 418 行。

我将这两个数据帧连接成一个新的数据帧full_data

full_data = pd.concat([train, test])

full_data现在包含 1309 行,但问题是,默认生成的index对于两个数据帧都是独立的。 index都是从一个开始的。

但我希望test数据帧索引应该从892而不是0开始。

我该怎么做?

2 个答案:

答案 0 :(得分:3)

https://stackoverflow.com/a/38898699/5675325中使用参数ignore_index=True

full_data = pd.concat([train, test], ignore_index=True)

答案 1 :(得分:1)

您可以执行以下操作: full_data = pd.concat([df1, df2]).reset_index(drop=True)