'标准'k-means聚类和快速k均值之间有什么区别?

时间:2015-02-05 21:31:57

标签: performance k-means

快速k-means算法如何工作,它与标准k-means有什么不同?

2 个答案:

答案 0 :(得分:1)

KMeans聚类是随机放置k个质心,每个质心一个。 将簇放置得越远,效果越好

K-means ++只是K-means的初始化过程。 在K-means ++中,您使用一种算法尝试选择初始质心,该算法试图初始化彼此相距较远的质心。 您随机选择一个点,这是您的第一个质心,然后根据一个概率(取决于到第一个点的距离)来选择下一个点,该点越远越可能。 然后,当您有两个质心时,便要重复此过程,每个点的概率取决于其到该点最近的质心的距离。

这在算法的初始化过程中产生了开销,但它降低了初始化错误导致聚类结果不好的可能性

答案 1 :(得分:0)

快速k-means 似乎是k-means++算法的替代名称。这里的想法是使用更复杂的播种程序"对于中心位置的初始选择,而标准k均值则使用随机分布来代替这些位置。 然后,通常的k-means算法在这种改进的启动配置上运行。

根据维基百科k-means ++通常会在两次或三次迭代中收敛,并且通常是标准k-means算法的两倍。