knnimpute如何运作?

时间:2017-03-02 19:48:22

标签: python machine-learning knn imputation

https://stackoverflow.com/a/35684975/4533188我得知K-Nearest Neighbor Imputation的工作原理如下:

  1. 对于当前观察,请与所有其他观察结果保持距离。
  2. 对于当前观察中的每个缺失值,请考虑所讨论的特征中没有缺失值的所有k个最近观察值。
  3. 根据这些观察的特征值:计算平均值(或某些类似的统计量) - 这是用于估算的值。
  4. 关键步骤是1:如果并非所有值都可用,我们如何计算距离?上面的帖子指向Heterogeneous Euclidean-Overlap Metric。但是我对fancyimpute的knn-imputation的实现很感兴趣。我将其追溯到https://github.com/hammerlab/knnimpute,更具体地说是https://github.com/hammerlab/knnimpute/blob/master/knnimpute/few_observed_entries.py,我查看了代码。但是我无法弄清楚它是如何工作的。

    有人可以向我解释knnimpute如何在那里工作?距离计算如何在这里工作?

0 个答案:

没有答案