我有一个包含多个自变量的逻辑回归,其中之一是分类的。这个变量是教育水平,从受教育程度最低到受教育程度最高,它有六个不同的水平。
我知道R默认使用参考水平(在这种情况下是最低的教育水平),然后我分别获得其他5个水平的系数/ p值等,以及其他所有水平的系数自变量。在计算边际效应时,我还获得了每个级别(除了1)的单独结果。
有没有办法让R得出不关于教育水平的5个单独结果,而是给我一个关于教育水平的统计意义和边际效应的结果?我一直在寻找以前的帖子,可能会回答这个问题,却找不到解决方案。
下面是我的代码和输出示例。
summary(logit.example2 <- glm(obese13 ~ gender + factor(wgt9) + smoke +
bfeed + pcgwgt1 + factor(pcgeducation), data = gui2, weights = wgt,
family = binomial(link = "logit"), na.action=na.omit))
R的输出:
Deviance Residuals:
Min 1Q Median 3Q Max
-3.9342 -0.1968 -0.0984 -0.0656 6.2956
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.79632 0.35844 -16.171 < 2e-16 ***
gender 0.25759 0.13594 1.895 0.05811 .
factor(wgt9)2 2.27494 0.18490 12.303 < 2e-16 ***
factor(wgt9)3 4.46575 0.19359 23.068 < 2e-16 ***
smoke 0.47266 0.14618 3.233 0.00122 **
bfeed 0.01011 0.14851 0.068 0.94573
pcgwgt1 0.66464 0.08803 7.551 4.34e-14 ***
factor(pcgeducation)2 0.19437 0.25597 0.759 0.44765
factor(pcgeducation)3 -0.75131 0.26892 -2.794 0.00521 **
factor(pcgeducation)4 -0.60424 0.30015 -2.013 0.04410 *
factor(pcgeducation)5 -0.59703 0.35817 -1.667 0.09553 .
factor(pcgeducation)6 -0.57877 0.49763 -1.163 0.24481
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2701.2 on 6238 degrees of freedom
Residual deviance: 1644.3 on 6227 degrees of freedom
(1056 observations deleted due to missingness)
AIC: 1664.6
Number of Fisher Scoring iterations: 7