凝聚层次聚类的确定级别

时间:2021-05-02 13:50:42

标签: python cluster-analysis data-mining

我将使用 AHC 对我的数据(轨迹数据)进行聚类。你能告诉我如何确定 AHC 的水平吗?

1 个答案:

答案 0 :(得分:0)

聚类的目的应该是簇本身应该远离彼此,簇内的点应该尽可能彼此靠近。

目标:这是我们必须最小化集群内距离和最大化集群间距离的另一种说法。

为此,我们使用了各种纯度措施,例如:

  1. Davies-Boulding 指数:https://en.wikipedia.org/wiki/Davies%E2%80%93Bouldin_index
  2. 轮廓值:https://en.wikipedia.org/wiki/Silhouette_(clustering) 或者,您可以在实现 AIM 的地方使用您的功能。

每次迭代后,您可以计算您制作的簇的纯度,并在达到最小值时停止