在数据聚类中使用k均值或k表示更好,以及为什么

时间:2015-02-02 02:06:50

标签: algorithm computer-science data-visualization

我在数据聚类中看到k表示++比k表示算法更好? 在数据挖掘中,k-means ++是一种用于为k-means聚类算法选择初始值(或#34;种子")的算法。 真的吗?请问,如果不说为什么?

感谢

2 个答案:

答案 0 :(得分:0)

k-means和k-means ++在初始阶段的差异使集群中心初始化更加稳定" (最小化类内方差)。

答案 1 :(得分:0)

k表示++不是完全不同的算法。 k-means ++只是以一种可证明的上限和其他部分保持相同的方式选择初始中心。根据您的需求,可能会更好或更糟。你可以自己说出为什么好或不好。