我试图用二分法DV在r中进行逐步逻辑回归。我研究了使用AIC选择模型的STEP函数,它基本上需要一个NUll和一个FULL模型。这是我一直在尝试的语法(我有很多IV,但N是100,000 +):
Full = glm(WouldRecommend_favorability ~ i1 + i2 + i3 + i4 + i5 + i6.....i83 + b14 +
Shift_recoded, data = ee2015, family = "binomial")
Nothing = glm(WouldRecommend_favorability ~ 1, data = ee2015, family = "binomial")
Full_Nothing_Step = step(Nothing, scope = Full,Nothing, scale = 0, direction = c('both'),
trace = 1, keep = NULL, steps = 1000, k = 2)
我不确定的一件事是在步骤公式中输入“Nothing”和“Full”的顺序。无论我尝试哪种方式,当我打印“Full_Nothing_Step”的摘要时,它只给出了“Nothing”或“Full:”的摘要
Call:
glm(formula = WouldRecommend_favorability ~ 1, family = "binomial",
data = ee2015)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.8263 0.1929 0.1929 0.1929 0.1929
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.97538 0.01978 201 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 25950 on 141265 degrees of freedom
Residual deviance: 25950 on 141265 degrees of freedom
AIC: 25952
Number of Fisher Scoring iterations: 6
我对logistic回归非常熟悉,但对R来说是新手。
答案 0 :(得分:2)
如文档所述,您可以输入范围作为公式和/或包含上限和下限的列表进行搜索。
在下面的示例中,我的初始模型是lm1,然后我在两个方向上实施逐步过程。该选择过程的界限是具有所有交互项的模型,而下界是所有项。您可以轻松地将其调整为glm模型并添加所需的其他参数。
请务必仔细阅读帮助页面。
lm1 <- lm(Fertility ~ ., data = swiss)
slm1 <- step(lm1, scope = list(upper = as.formula(Fertility ~ .^2),
lower = as.formula(Fertility ~ .)),
direction = "both")