在R中对其应用pca后,减小数据集的维数

时间:2013-09-16 09:13:44

标签: r k-means pca dimensionality-reduction

我的问题是如何使用R获得的主要成分。

获得主要组件后,我们如何使用它来减小尺寸? 我有一个包含6个变量的data_set,我需要使用k-means对它进行聚类。当我对6个变量进行聚类时,K-means给出了一个分散的图。我认为pca可以帮助减小尺寸,因此k-means可以产生丰硕的成果。

我这样做是为了获得主要成分:

pca1 <- prcomp(data_set)

请指导我如何进一步降低数据集的维度。

1 个答案:

答案 0 :(得分:1)

如果输入例如?prcomp,您可以找到从函数中获得的值 这就是我以前用另一个包做的事情:

library("FactoMineR")

pca <- PCA(dataset, scale.unit=TRUE, graph=FALSE)

scores <- data.frame(pca$ind$coord)

library(ggplot2)

ggplot(scores,aes(Dim.1,Dim.2)) + geom_text(label=rownames(scores),colour="red") + geom_hline(yintercept=0) + geom_vline(xintercept=0) + labs(title="Score plot")

你可以根据PC1和PC2得到分数的图表,如果你想要加载图,也可以得到相同的分数

loadings <- data.frame(pca$var$coord)