Question

我正在尝试聚类从科学数据中生成的数据矩阵。我知道我希望如何完成聚类，但我不确定如何在R中完成这项专长。

以下是数据的样子：

            A1     A2     A3     B1     B2     B3     C1     C2     C3
sample1      1      9     10      2      1     29      2      5     44
sample2      8      1     82      2      8      2      8      2     28
sample3      9      9     19      2      8      1      7      2     27

请考虑A1，A2，A3为单次处理的三次重复，同样使用B和C.样品1是不同的测试变量。所以，我想对这个矩阵进行分层聚类，以便查看列之间的所有差异，特别是我将制作一个树形图（树）来观察列的相关性。

有谁知道如何适当地聚类这样的东西？我尝试这样做：

raw.data <- read.delim("test.txt",header=FALSE,stringsAsFactors=FALSE)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)

...但是，这导致树具有每个样本变量的分支，而不是每个列。谢谢你的任何建议！

Answer 1

只需转置您的数据集：

raw.data <- t(raw.data)
require(vegan)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)

如何在R中分层聚类数据矩阵？

1 个答案: