我正在尝试实现k意味着聚类。
我有一组带坐标(x,y)的点,我正在使用欧几里德距离来寻找距离。我计算了矩阵中所有点之间的距离
dist [i] [j] - 点i和j之间的距离
当我选择离pt 1最远的[1] [3]为3时。
然后当我从3搜索最远时,我可能得到[3] [j],但[1] [j]可能是最小的。
[pt j远离pt3但接近1]
所以如何使用距离矩阵选择k最远点。
答案 0 :(得分:0)
请注意,k-farthest点不一定能产生最佳结果:它们显然不是最佳的聚类中心估计值。
另外,由于k-means启发式算法可能会陷入局部最小值,因此您需要一种随机算法,允许您多次重启该过程并获得潜在的不同结果。
您可能需要查看k-means ++,这是k-means初始化的已知良好启发式。