Question

我的问题是如何使用R获得的主要成分。

获得主要组件后，我们如何使用它来减小尺寸？我有一个包含6个变量的data_set，我需要使用k-means对它进行聚类。当我对6个变量进行聚类时，K-means给出了一个分散的图。我认为pca可以帮助减小尺寸，因此k-means可以产生丰硕的成果。

我这样做是为了获得主要成分：

pca1 <- prcomp(data_set)

请指导我如何进一步降低数据集的维度。

Answer 1

如果输入例如？prcomp，您可以找到从函数中获得的值这就是我以前用另一个包做的事情：

library("FactoMineR")

pca <- PCA(dataset, scale.unit=TRUE, graph=FALSE)

scores <- data.frame(pca$ind$coord)

library(ggplot2)

ggplot(scores,aes(Dim.1,Dim.2)) + geom_text(label=rownames(scores),colour="red") + geom_hline(yintercept=0) + geom_vline(xintercept=0) + labs(title="Score plot")

你可以根据PC1和PC2得到分数的图表，如果你想要加载图，也可以得到相同的分数

loadings <- data.frame(pca$var$coord)

在R中对其应用pca后，减小数据集的维数

1 个答案: