我们可以比较具有C指数平均值的聚类吗?

时间:2014-12-09 08:14:55

标签: data-mining clustered-index knime

我使用K-Means算法来创建聚类。如您所知,K-means算法需要群集计数作为参数。我尝试将簇计数从8开始,并计算每个循环中所有簇的C-Index,然后得到这些C-Index的平均值。然后比较C-Index avegares并选择最小C-Index平均值作为最佳质量簇数。这是检测群集计数的真正方法吗?

1 个答案:

答案 0 :(得分:1)

没有一种正确的方法来检测群集数量。请参阅以下google search,这仍然是一个活跃的研究领域。 Wikipedia文章说:

  

正确选择k通常是模糊的,解释取决于数据集中点分布的形状和比例以及用户所需的聚类分辨率。

只有您可以确定以这种方式使用c-index是否是确定域中群集号的好方法。请参阅使用c-index in clustering的其他问题。