轮廓分数表明群集的最佳大小是2?

时间:2019-11-03 02:33:23

标签: cluster-computing k-means silhouette

我正在使用k-medoid将数据集聚类为聚类。每个数据点都是高维数据。但是我只关心数据点之间的相关性,而不关心数据的绝对值(例如[1,2,1]和[3,6,3]应该放在同一簇中),所以我使用皮尔逊相关系数作为距离(1-r,r = 1表示正相关)。我使用轮廓分数来确定聚类数。但是,从2到50的簇大小,得分一直在下降。这是否意味着2个群集是最佳选择?我不明白从可视化中,我看到了价值变化的一些不同模式。

0 个答案:

没有答案