快速k-means算法如何工作,它与标准k-means有什么不同?
答案 0 :(得分:1)
KMeans聚类是随机放置k个质心,每个质心一个。 将簇放置得越远,效果越好
K-means ++只是K-means的初始化过程。 在K-means ++中,您使用一种算法尝试选择初始质心,该算法试图初始化彼此相距较远的质心。 您随机选择一个点,这是您的第一个质心,然后根据一个概率(取决于到第一个点的距离)来选择下一个点,该点越远越可能。 然后,当您有两个质心时,便要重复此过程,每个点的概率取决于其到该点最近的质心的距离。
这在算法的初始化过程中产生了开销,但它降低了初始化错误导致聚类结果不好的可能性。
答案 1 :(得分:0)
快速k-means 似乎是k-means++算法的替代名称。这里的想法是使用更复杂的播种程序"对于中心位置的初始选择,而标准k均值则使用随机分布来代替这些位置。 然后,通常的k-means算法在这种改进的启动配置上运行。
根据维基百科k-means ++通常会在两次或三次迭代中收敛,并且通常是标准k-means算法的两倍。