我的数据集包含3个类别{c1,c2和c3}。我正在使用单链接层次聚类方法(来自matlab)来聚类数据集。我建立了自己的距离测量。下图显示了结果。注意,层次聚类方法正确地聚类数据;其中c1(黄色)的点非常接近。类似地,c2(绿色)和c3(蓝色)。
从图中可以看出,与c2和c3相比,c1中各点之间的距离非常小。因此,例如,如果我决定在8处切割树,这将导致c1,c2和c3将被分割成8个簇;每个点将在不同的集群中。
我怎样才能克服这个问题;我需要更改聚类方法吗?或者在17处砍树并再次聚类生成的簇?
答案 0 :(得分:0)
从树形图中提取簇有不同的方法。您不需要进行单一切割(尽管matlab可能只提供此选择)。选择像你这样的区域也是合理的,因此在多个高度处切割树形图。但并非每种工具都具备所有功能。
请注意,c3被分成两部分,其中一半与c2没有很好的分离。