我试图利用K-means clustering方法解决类似于维基百科的问题。
最小化聚类内的平方和(WCSS):
但在我的表述中,必须最小化群内模块总和。
给出整数X和簇数k的集合。需要选择k个簇整数mu的值,以便最小化差异模块的簇内总和。
我正在以交互方式执行此操作,随机选取初始mu
值,然后将其调整为分配给群集的元素的平均值。
但是,这种方法只能为简单的测试用例提供正确答案。
答案 0 :(得分:1)
“正确答案”是什么意思? K均值严格依赖于初始条件(随机选择的初始平均中心)和数据分布。无法保证您始终获得相同的平均分配中心。