如何在凝聚层次聚类算法中绘制完整链接方法的树形图

时间:2015-09-17 12:18:22

标签: cluster-analysis hierarchical-clustering

在计算每个元素相互之间的距离后,创建完整链接方法的树形图的下一步应该是什么?

1 个答案:

答案 0 :(得分:1)

想象一下,我们有6个数据项i1,i2,i3,i4,i5,i6,它们的距离应该如下图所示。

      i1     i2     i3     i4     i5     i6
---------------------------------------------
i1     -
i2   d1.2     -
i3   d1.3   d2.3     -
i4   d1.4   d2.4   d3.4     -
i5   d1.5   d2.5   d3.5   d4.5     -
i6   d1.6   d2.6   d3.6   d5.6   d5.6    -

完整链接意味着最远的邻居。所以这应该在树形图中表达。树形图中垂直轴的最后一个值是最长距离。

首先选择距离最小的一对。如果有多个具有相同距离值的货币对,则从您第一次遇到的货币对开始。 [宁愿一行一行地得到第一对遇到的]然后将树枝图中的两对与纵轴中的距离值合并。 [绘制树形图时,最好不要在开始时标记轴值。在完成整个过程时标记它们,这样可以避免重叠线。]

然后去下一对。如果这个新对影响树形图中已有的对,请检查那些可以构建的对的距离是否具有比新对距离更高的值。如果是这样,请忽略新对并继续下一步。如果它没有,你可以在树形图中将它们与垂直轴上的距离值合并。

例如:

  • 最低距离为d2.3。
  • d2.3< d3.4< ..............< D2.4

因此,i2和i3在树形图中以垂直轴d2.3的值合并。 下一对(i3,i4)影响已经在树形图中的i3,如果合并,它可以构建另一对(i2,i4)。由于它的距离d2.4远高于d3.4,所以现在可以忽略这对新的对(i3,i4)而不合并。

同样,您可以绘制描绘距离最远的最远邻居的树形图。