我正在进行主成分分析,以减少数据集数量较少的回归模型的变量数量。大量的自变量(大约40个独立变量)。
我使用函数princomp
生成主成分,因为我有自变量之间的相关性。但我不知道如何根据PCA的数量使用princomp输出。我'我有兴趣使用主成分的子集进行预测
你能帮帮我吗?
提前致谢
答案 0 :(得分:0)
my_pca <- prcomp(data)
summary(my_pca)
总结中的标准差是特征值的平方根。 您可以使用Kaiser标准:仅保留具有特征值的因子/分量&gt; 1。
pc1 <- my_pca$x[,1] # 1st component
pc2 <- my_pca$x[,2] # 2nd component
...