我使用以下代码创建了逐步回归:
set.seed(1)
y=rnorm(100,20)
a=sqrt(rnorm(100,40))-15
b=rnorm(100,50)/abs(a)
c=sqrt(b+y)
d=rnorm(100,13)+sqrt(abs(a))
test_data <- data.frame(y,a,b,c,d)
step1<- step(lm(y~a+b+c+d,data=test_data),direction="backward")
summary(step1)
逐步回归给了我这个公式lm(formula = y ~ b + c, data = test_data)
。意思是如果我使用b和c来预测y,我可以得到最好的模型。
我想知道的是,是否有自动代码/方式来创建包含重要自变量和因变量的数据框,如:data.frame(test_data$y,test_data$b,test_data$c)
。
提前致谢。