我想使用KNN在sklearn管道中插补分类特征(缺少多个分类特征)。
我对现有的KNN解决方案(fancyimpute,sklearn KneighborRegressor)进行了大量研究。他们似乎都没有用
我的一些问题是(任何建议都值得赞赏):
答案 0 :(得分:1)
默认的KNeighborRegressor应该能够对缺失值进行回归,但是只能对数字值进行回归。因此,对于绝对值,我相信您很可能需要先对其进行编码,然后再估算缺失的值。
KNNImpute,最有可能使用均值/众数等
迭代计算机可以对整个数据集进行插补
答案 1 :(得分:0)
KNNImputer是sklearn 0.22.0版中的新功能
KNNImputer默认情况下使用欧几里德距离度量标准,但是您可以传入自己的自定义距离度量标准。
我无法说出KNNImputer的速度,但我想如果将它制成sklearn,就可以对其进行一些优化。