如何将距离矩阵插入R并运行分层聚类

时间:2016-02-21 18:23:29

标签: r matrix distance hierarchical-clustering

我知道如果我有原始数据,我可以创建一个距离矩阵,但是对于这个问题,我有一个距离矩阵,我希望能够在它上面运行R中的命令,比如hclust。下面是我在R中想要的距离矩阵。我不确定以矩阵形式存储这些数据会起作用,因为我将无法在矩阵上运行hclust。

enter image description here

我尝试使用as.dist函数创建它无济于事。我错误的代码:

test=as.dist(c(.76,2.97,4.88,3.86,.8,4.17,1.96,.21,1.51,.51), diag = FALSE, upper = FALSE)
test
      1    2    3    4    5    6    7    8    9
2  2.97                                        
3  4.88 2.97                                   
4  3.86 4.88 0.51                              
5  0.80 3.86 2.97 0.21                         
6  4.17 0.80 4.88 1.51 0.80                    
7  1.96 4.17 3.86 0.51 4.17 0.51               
8  0.21 1.96 0.80 2.97 1.96 2.97 0.80          
9  1.51 0.21 4.17 4.88 0.21 4.88 4.17 0.21     
10 0.51 1.51 1.96 3.86 1.51 3.86 1.96 1.51 0.51

1 个答案:

答案 0 :(得分:4)

由于您已有距离值,因此无需使用dist()来计算它们。数据可以存储在常规矩阵中

test <- matrix(ncol=5,nrow=5)
test[lower.tri(test)] <- c(.76,2.97,4.88,3.86,.8,4.17,1.96,.21,1.51,.51)
diag(test) <- 0

> test
     [,1] [,2] [,3] [,4] [,5]
[1,] 0.00   NA   NA   NA   NA
[2,] 0.76 0.00   NA   NA   NA
[3,] 2.97 0.80 0.00   NA   NA
[4,] 4.88 4.17 0.21 0.00   NA
[5,] 3.86 1.96 1.51 0.51    0

为了应用hclust(),可以将此矩阵转换为as.dist()的距离矩阵:

> test <- as.dist(test, diag = TRUE)
     1    2    3    4    5
1 0.00                    
2 0.76 0.00               
3 2.97 0.80 0.00          
4 4.88 4.17 0.21 0.00     
5 3.86 1.96 1.51 0.51 0.00
> hclust(test)
#
#Call:
#hclust(d = test)
#
#Cluster method   : complete 
#Number of objects: 5 
> plot(hclust(test))

enter image description here