我的问题是如何使用R获得的主要成分。
获得主要组件后,我们如何使用它来减小尺寸? 我有一个包含6个变量的data_set,我需要使用k-means对它进行聚类。当我对6个变量进行聚类时,K-means给出了一个分散的图。我认为pca可以帮助减小尺寸,因此k-means可以产生丰硕的成果。
我这样做是为了获得主要成分:
pca1 <- prcomp(data_set)
请指导我如何进一步降低数据集的维度。
答案 0 :(得分:1)
如果输入例如?prcomp,您可以找到从函数中获得的值 这就是我以前用另一个包做的事情:
library("FactoMineR")
pca <- PCA(dataset, scale.unit=TRUE, graph=FALSE)
scores <- data.frame(pca$ind$coord)
library(ggplot2)
ggplot(scores,aes(Dim.1,Dim.2)) + geom_text(label=rownames(scores),colour="red") + geom_hline(yintercept=0) + geom_vline(xintercept=0) + labs(title="Score plot")
你可以根据PC1和PC2得到分数的图表,如果你想要加载图,也可以得到相同的分数
loadings <- data.frame(pca$var$coord)