我正在尝试聚类从科学数据中生成的数据矩阵。我知道我希望如何完成聚类,但我不确定如何在R中完成这项专长。
以下是数据的样子:
A1 A2 A3 B1 B2 B3 C1 C2 C3
sample1 1 9 10 2 1 29 2 5 44
sample2 8 1 82 2 8 2 8 2 28
sample3 9 9 19 2 8 1 7 2 27
请考虑A1,A2,A3为单次处理的三次重复,同样使用B和C.样品1是不同的测试变量。所以,我想对这个矩阵进行分层聚类,以便查看列之间的所有差异,特别是我将制作一个树形图(树)来观察列的相关性。
有谁知道如何适当地聚类这样的东西?我尝试这样做:
raw.data <- read.delim("test.txt",header=FALSE,stringsAsFactors=FALSE)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)
...但是,这导致树具有每个样本变量的分支,而不是每个列。谢谢你的任何建议!
答案 0 :(得分:2)
只需转置您的数据集:
raw.data <- t(raw.data)
require(vegan)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)