我从两个csv
文件中读取了两个数据帧。
train = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\train.csv")
test = pd.read_csv(r"C:\Users\DIU\Desktop\ML-titanic\test.csv")
在train
数据框中,我有 891 行,在test
数据框中,我有 418 行。
我将这两个数据帧连接成一个新的数据帧full_data
。
full_data = pd.concat([train, test])
full_data
现在包含 1309 行,但问题是,默认生成的index
对于两个数据帧都是独立的。 index
都是从一个开始的。
但我希望test
数据帧索引应该从892而不是0开始。
我该怎么做?
答案 0 :(得分:3)
在https://stackoverflow.com/a/38898699/5675325中使用参数ignore_index=True
:
full_data = pd.concat([train, test], ignore_index=True)
答案 1 :(得分:1)
您可以执行以下操作:
full_data = pd.concat([df1, df2]).reset_index(drop=True)