如何通过唯一的rowID组合两个数据帧,一个的值比另一个的少

时间:2018-10-12 05:36:35

标签: python pandas dataframe

我有两个数据框。一个是输出数据集,另一个是原始数据集。由于输出数据集已经过预处理;离群值和NA值被删除,这已摆脱了数据集中的rowID,因此具有较小的值。我正在尝试将classfier从输出数据集输出到原始数据集。但是我总是遇到错误。关于如何将具有相应rowID的分类器值附加到原始数据集的任何建议。

谢谢。

我的代码。

predictions=clf_A.predict(data_test)

df = pd.read_csv("/Documents/TestingSet(4) (4).csv")

for i in range(0,len(df)):
    if(df['row ID'][i]==data_test['row ID'][i])
    df['QUALIFIED'][i] = predictions[i]


df.to_csv("TestingSet(4) (4).csv", index=False)

//df-Original dataSet
//data_set=output dataset with my classifier predictions

0 个答案:

没有答案