我在我的数据集样本上计算了PCA,并保留了前两个分量向量。然后我用k = 3计算了前两个分量的k均值聚类。 现在我需要绘制一个2D散点图,其中包含前两个本征函数(来自PCA)和基于聚类组的颜色。我用散点图完成了一切,但是当我看到图时,我无法区分哪些样本是聚类的,所以我想将样本标签添加到散点图中的点。 谁能建议我怎么做呢?
tdata<-t(subdata)
pca <- prcomp((tdata),cor=F)
dat.loadings <-pca$x[,1:2]
cl <- kmeans(dat.loadings, centers=3)
pca1 <-pca$x[,1]
pca2 <-pca$x[,2]
plot(pca1, pca2,xlab="PCA-1",ylab="PCA-2",col=cl$cluster)
谢谢
答案 0 :(得分:3)
这可以简单地使用ggplot来完成。我将使用mtcars数据,因为我无法访问您当前使用的数据集。无论如何,这个想法应该很清楚。
library(ggplot2)
pca <- prcomp((mtcars),cor=F)
dat.loadings <-pca$x[,1:2]
cl <- kmeans(dat.loadings, centers=3)
pca1 <-pca$x[,1]
pca2 <-pca$x[,2]
#plot(pca1, pca2,xlab="PCA-1",ylab="PCA-2",col=cl$cluster)
mydf<-data.frame(ID=names(pca1),PCA1=pca1, PCA2=pca2, Cluster=factor(cl$cluster))
ggplot(mydf, aes(x=PCA1, y=PCA2, label=ID, color=Cluster)) +
geom_point() + geom_text(size = 4, colour = "black", vjust = -1)
这为您提供了每个数据点的名称输出。