标签: python scikit-learn data-science k-means
我有一个聚类问题,我决定使用Kmeans解决。我有约100个样本,5个聚类和8个属性。首先,我使用StandardScaller对样本进行标准化处理。最终,我得到了群集,并决定以这种方式检查与“最佳”群集的距离:
我不知道如何,但是有些样本中kmeans的簇!=最佳簇(这是使用kmeans的质心来计算的)
我的问题是这怎么可能?
我尝试设置n_init参数(kmeans随机选择质心的次数),但没有帮助,仍然有一些样本比kmeans最初提供的样本更接近其他kmeans簇