从https://stackoverflow.com/a/35684975/4533188我得知K-Nearest Neighbor Imputation的工作原理如下:
关键步骤是1:如果并非所有值都可用,我们如何计算距离?上面的帖子指向Heterogeneous Euclidean-Overlap Metric。但是我对fancyimpute的knn-imputation的实现很感兴趣。我将其追溯到https://github.com/hammerlab/knnimpute,更具体地说是https://github.com/hammerlab/knnimpute/blob/master/knnimpute/few_observed_entries.py,我查看了代码。但是我无法弄清楚它是如何工作的。
有人可以向我解释knnimpute
如何在那里工作?距离计算如何在这里工作?