Question

我从两个csv文件中读取了两个数据帧。

train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")

在train数据框中，我有 891 行，在test数据框中，我有 418 行。

我将这两个数据帧连接成一个新的数据帧full_data。

full_data = pd.concat([train, test])

full_data现在包含 1309 行，但问题是，默认生成的index对于两个数据帧都是独立的。 index都是从一个开始的。

但我希望test数据帧索引应该从892而不是0开始。

我该怎么做？

Answer 1

full_data = pd.concat([train, test], ignore_index=True)

Answer 2

您可以执行以下操作： full_data = pd.concat([df1, df2]).reset_index(drop=True)