用R聚类

时间:2015-11-05 10:45:44

标签: r hierarchical-clustering euclidean-distance

我有一个data.frame,例如:

dist(test)
#             1           2           3           4           5
# 2  471.181726                                                
# 3 1019.716766  714.553473                                    
# 4  425.980071  427.331552 1102.568122                        
# 5  428.325768  426.014214 1101.559808    8.062258            
# 6  427.427492  425.995993 1100.387152   10.000000    8.062258

和我的距离矩阵

hclust(dist(test))

我有我的分层聚类({{1}})并且我想要放入一个组,例如距离小于10的所有行(例如,这将是4和5和6)< / p>

但实际上,我的data.frame要大得多,我想自动完成。

1 个答案:

答案 0 :(得分:0)

首先:保存层次聚类。

NA

注意我选择了tree <- hclust(dist(test), method="complete") 链接方法。您可以详细了解原因及其运作方式HERE

第二:在想要的高度切割树(在你的情况下,这是10):

complete

如您所见,这会返回一个聚类向量。在这种情况下,cutree(tree, h=10) # 1 2 3 4 5 6 # 1 2 3 4 4 4 所有人都在您想要的同一群集4,5,6中。选择4可确保一个群集中所有点之间的最大距离是您使用method="complete"指定的距离。