我有两个相同变量的聚类结果,但每次都有不同的值。让我们使用以下代码创建它们:
set.seed(11)
a<-matrix(rnorm(10000),ncol=100)
colnames(a)<-(c(1:100))
set.seed(31)
b<-matrix(rnorm(10000),ncol=100)
colnames(b)<-colnames(a)
c.a<-hclust(dist(t(a)))
c.b<-hclust(dist(t(b)))
# clusters
groups.a<-cutree(c.a, k=15)
# take groups names
clus.a=list()
for (i in 1:15) clus.a[[i]] <- colnames(a)[groups.a==i]
# see the clusters
clus.a
groups.b<-cutree(c.b, k=15)
clus.b=list()
for (i in 1:15) clus.b[[i]] <- colnames(b)[groups.b==i]
# see the clusters
clus.b
我从中得到的是两个列表clus.a
和clus.b
,其中包含每个群集变量的名称(此处只是1到100之间的数字)。
有没有办法检查两个聚类中是否有哪些变量聚集在一起?意思是,我怎样才能看到clus.a
和clus.b
在同一群集中是否有变量(可能是2,3,4等的团队)(不必相同)簇号)。