sklearn.cluster.KMeans如何处理带有缺失质心的init ndarray参数(可用质心小于n_clusters)?

时间:2015-05-11 13:46:29

标签: python scikit-learn k-means

在Python sklearn KMeans(see documentation)中,我想知道在将ndarray形状(n,n_features)传递给init参数时,内部会发生什么,何时{{1} }

  1. 它是否会丢弃给定的质心,只是启动kmeans ++初始化,这是n<n_clusters参数的默认选择? (PDF paper kmeans++)(How does Kmeans++ work
  2. 是否考虑给定的质心并使用kmeans ++填充相应地剩余的质心?
  3. 是否考虑给定的质心并使用随机值填充剩余的质心?
  4. 我没想到在这种情况下此方法不会返回警告。这就是为什么我需要知道它如何管理它。

1 个答案:

答案 0 :(得分:1)

如果您给它一个不匹配的init,它会调整群集的数量,正如您从source中看到的那样。这没有记录,我认为这是一个错误。 我建议修理它。