在R中,如何在运行具有大量变量的多元回归之后仅提取重要变量

时间:2012-05-03 00:31:41

标签: r linear-regression data-analysis

在R中运行多元回归后,回归摘要会显示带有星号的重要变量。在我正在研究的数据集中,有近2000个变量,R确定的重要变量包含50多个变量。有没有什么方法可以从回归总结中单独获得重要变量列表。

1 个答案:

答案 0 :(得分:10)

这是为什么你不应该做你要求我们做的事情的一个例子:

randf <- as.data.frame(matrix(rnorm(800*400), 800, 400))
names(randf)[1] <- "Y"
big.mod <- lm(Y ~ ., data=randf)
sum( summary(big.mod)$coefficients[ ,4] < 0.05 )
#[1] 22

因此我们得到22个有效系数(其中一些“非常重要”)只是将400个随机变量与另一个随机变量相关联。