r中逐步逻辑回归的语法

时间:2015-12-14 23:14:08

标签: r logistic-regression

我试图用二分法DV在r中进行逐步逻辑回归。我研究了使用AIC选择模型的STEP函数,它基本上需要一个NUll和一个FULL模型。这是我一直在尝试的语法(我有很多IV,但N是100,000 +):

Full = glm(WouldRecommend_favorability ~ i1 + i2 + i3 + i4 + i5 + i6.....i83 + b14 + 
                                         Shift_recoded, data = ee2015, family = "binomial")
Nothing = glm(WouldRecommend_favorability ~ 1, data = ee2015, family = "binomial")
Full_Nothing_Step = step(Nothing, scope = Full,Nothing, scale = 0, direction = c('both'), 
                         trace = 1, keep = NULL, steps = 1000, k = 2)

我不确定的一件事是在步骤公式中输入“Nothing”和“Full”的顺序。无论我尝试哪种方式,当我打印“Full_Nothing_Step”的摘要时,它只给出了“Nothing”或“Full:”的摘要

Call:
glm(formula = WouldRecommend_favorability ~ 1, family = "binomial", 
    data = ee2015)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.8263   0.1929   0.1929   0.1929   0.1929  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.97538    0.01978     201   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 25950  on 141265  degrees of freedom
Residual deviance: 25950  on 141265  degrees of freedom
AIC: 25952

Number of Fisher Scoring iterations: 6 

我对logistic回归非常熟悉,但对R来说是新手。

1 个答案:

答案 0 :(得分:2)

如文档所述,您可以输入范围作为公式和/或包含上限和下限的列表进行搜索。

在下面的示例中,我的初始模型是lm1,然后我在两个方向上实施逐步过程。该选择过程的界限是具有所有交互项的模型,而下界是所有项。您可以轻松地将其调整为glm模型并添加所需的其他参数。

请务必仔细阅读帮助页面。

lm1 <- lm(Fertility ~ ., data = swiss)

slm1 <- step(lm1, scope = list(upper = as.formula(Fertility ~ .^2),
                               lower = as.formula(Fertility ~ .)),
             direction = "both")