就质心点距离而言,Sklearn的Kmeans聚类不对应于Best聚类

时间:2020-05-19 09:44:02

标签: python scikit-learn data-science k-means

我有一个聚类问题,我决定使用Kmeans解决。我有约100个样本,5个聚类和8个属性。首先,我使用StandardScaller对样本进行标准化处理。最终,我得到了群集,并决定以这种方式检查与“最佳”群集的距离:

  1. 我得到kmeans.cluster_weights_,每个质心(5)的属性值(8)。
  2. 我针对每个属性计算每个聚类质心(5)与每个样本(100)之间的距离(以绝对减法计算),并为每个样本放置最佳聚类(所有计算均使用缩放数据)

我不知道如何,但是有些样本中kmeans的簇!=最佳簇(这是使用kmeans的质心来计算的)

我的问题是这怎么可能?

我尝试设置n_init参数(kmeans随机选择质心的次数),但没有帮助,仍然有一些样本比kmeans最初提供的样本更接近其他kmeans簇

0 个答案:

没有答案