标签: algorithm distance data-mining k-means
我一直在研究和研究基于分区的聚类算法,如K-means和K-Medoids。我已经了解到,与K-means相比,K-medoids对异常值更强。但是我很好奇如果在分配数据点期间,两个或多个集群代表在数据点上具有相同的距离会发生什么。您将为哪个群集分配数据点?将数据分配指向群集是否会极大地影响群集结果?
答案 0 :(得分:1)
为了防止发生不良事件(无限循环等),总是更喜欢群集已被分配的点。