我有一个数字(连续)因变量和40多个自变量。 (2个数字,3个类别,其余为虚拟变量)。我尝试同时进行前向和后向选择,以使模型中的预测变量变小:
nullmod <- lm(y ~ 1, data = df)
fullmod <- lm(y ~ x1 + x2 + x3 .... + x40, data = df)
reg1A <- step(nullmod, scope = list(lower = nullmod, upper = fullmod),
direction = "forward")
我也对direction =“ backward
结果表明,我的模型最好,不添加任何变量!而当我使用一些变量进行多元回归时,我得到了相当可观的结果。为什么呢?