我正在研究主成分回归。我的数据集由150个变量和60个观察值组成。我知道我应该有更多的观察而不是变量。我在我的数据集上使用了PCA。我通过PCA收到了9个因素。某些因素包括具有正负载的变量。之后,我使用因子分数和因变量进行了多元回归。那里也出现了正负回归系数。我的问题是,如何在积极和消极的组合中实施因子载荷和回归系数?
例如:因子1具有回归系数-0.17,var1因子加载0.4,var3因子加载-0.3和var7因子加载-0.22。因子2的回归系数为0.28,var2因子加载为-0.21,var3因子加载为0.4,var6因子加载为-0.3。
我的目标是创建150个变量的组,为这些组命名,并能够解释哪些组导致y值更高或更低。我想知道这些组中的变量是否增加或减少。 到目前为止,我已将x变量标准化。我测试了使用parallels分析时使用了多少因素,并使用以下代码应用了PCA:
nipals (xVars, a = 9)
scores <- (nipals (xVars, a = 9) $ T)
loadings <- (nipals (xVars, a = 9) $ P)
使用因子分数我应用回归分析,其中x1到9是我的因子的分数。 fit <- lm (y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9)
。我的模型摘要给出了系数。如何用相应的因子载荷实现这些系数?
数据:
y x1 x2 x3 x4 x5
-1,392 0,033 4,471 0,038 0,148 2,208
2,740 0,066 52,836 0,041 0,526 0,186
-0,066 0,219 10,559 0,132 0,488 0,230
因素加载:
F1 F2 F3 F4
1 0,10 0,07 0,16 0,08
2 0,05 -0,03 -0,01 -0,22
3 0,14 0,06 0,05 0,01
4 0,12 -0,08 -0,01 -0,03
5 0,12 -0,12 -0,03 0,07