我目前在python中实现了均值漂移聚类。我使用matplotlib,我得到的结果是我期望在随机输入上进行聚类。但是,我对于如何通常将每个点的集群缩减为几个集群感到困惑。
我的意思是平均移位输出每个点作为一个簇,尽管许多点实际上可能对应于同一个簇。我有几种方法可以理解这可以做到,但对我来说似乎很奇怪,我查看过的单一教程实际上并未解释如何在输出中实际提取唯一的集群:
可以为每个点创建一个聚类列表,并在对每个点进行移位后,检查新创建的聚类是否等于给定点(或某个近距离度量)添加原始点转移到集群的点。另外,创建一个新的集群作为对[cluster_location:[cluster_points]]
可以使用散列(字典)散列集群位置,然后如果当前集群位置存在,则将未移位的点添加到该集群,否则创建新的集群散列索引。
我倾向于做B,但我想知道从Mean Shift实际获取群集的标准方法是什么。