标签: python missing-data knn imputation
我的数据集很大,缺少很多值。一些变量高达30%。删除不是一种选择。最好的估算方式是什么? 对于KNN,当我运行
df_KNN = pd.DataFrame(data=KNN(k=10).fit_transform(incomplete_data),columns=incomplete_data.columns, index=incomplete_data.index)
我仍然缺少一些值。如何估算所有丢失的数据?