如何调整K-means聚类?

时间:2013-05-03 15:45:34

标签: algorithm cluster-analysis

我试图利用K-means clustering方法解决类似于维基百科的问题。

  

最小化聚类内的平方和(WCSS):

但在我的表述中,必须最小化群内模块总和

  

给出整数X和簇数k的集合。需要选择k个簇整数mu的值,以便最小化差异模块的簇内总和。

我正在以交互方式执行此操作,随机选取初始mu值,然后将其调整为分配给群集的元素的平均值。

但是,这种方法只能为简单的测试用例提供正确答案。

1 个答案:

答案 0 :(得分:1)

“正确答案”是什么意思? K均值严格依赖于初始条件(随机选择的初始平均中心)和数据分布。无法保证您始终获得相同的平均分配中心。