基于重要的自变量在R中创建新数据框

时间:2015-05-05 06:11:58

标签: r dataframe regression

我使用以下代码创建了逐步回归:

set.seed(1)
y=rnorm(100,20)
a=sqrt(rnorm(100,40))-15
b=rnorm(100,50)/abs(a)
c=sqrt(b+y)
d=rnorm(100,13)+sqrt(abs(a))

test_data <- data.frame(y,a,b,c,d)

step1<- step(lm(y~a+b+c+d,data=test_data),direction="backward")
summary(step1)

逐步回归给了我这个公式lm(formula = y ~ b + c, data = test_data)。意思是如果我使用b和c来预测y,我可以得到最好的模型。

我想知道的是,是否有自动代码/方式来创建包含重要自变量和因变量的数据框,如:data.frame(test_data$y,test_data$b,test_data$c)

提前致谢。

0 个答案:

没有答案