我一直在尝试Lumer-Faieta聚类, 有希望的结果:
但是,随着集群的形成,我想知道如何识别最终的集群?我是否运行另一种聚类算法来识别聚类(看起来适得其反)?
我想到了在其自己的集群中启动每个数据点的想法。然后,当一个满载的蚂蚁掉落一个数据点时,它得到与支配其邻域的数据点相同的群集。问题在于,如果群集被分解,它们共享相同的群集编号。
我被困住了。有什么建议吗?
答案 0 :(得分:0)
为解决此问题,我采用了DBSCAN作为后处理步骤。效果如下:
鉴于我们在已知距离和均匀密度的2D网格上投影了一个高维问题,因此DBSCAN是解决此问题的理想选择。为epsilon选择正确的值和最少的邻居数是微不足道的(两个值我都使用3)。一旦识别出群集,就可以将其投影回n维空间。
有关The 5 Clustering Algorithms Data Scientists Need to Know的DBSCAN和其他一些聚类算法的简要概述,请参见{3>}。