在回归摘要中报告分类预测变量的基本级别

时间:2014-03-17 16:36:43

标签: r regression

假设myGlm是R中的glm对象。

summary(myGlm)显示所有有趣虚拟变量的系数估计值。但是,我经常不知道参考水平是什么,因为我有很多级别的名义因素。是否存在输出基准水平和估算值的方法?

(如果这真的应该在SO中,请提前道歉,不知道该放在哪里)

编辑以包含示例

counts <- c(18,17,15,20,10,20,25,13,12)
outcome <- gl(3,1,9)
treatment <- gl(3,3)
print(d.AD <- data.frame(treatment, outcome, counts))
glm.D93 <- glm(counts ~ outcome + treatment, family = poisson())
summary(glm.D93)

Call:
glm(formula = counts ~ outcome + treatment, family = poisson())

Deviance Residuals: 
       1         2         3         4         5         6         7         8         9  
-0.67125   0.96272  -0.16965  -0.21999  -0.95552   1.04939   0.84715  -0.09167  -0.96656  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.045e+00  1.709e-01  17.815   <2e-16 ***
outcome2    -4.543e-01  2.022e-01  -2.247   0.0246 *  
outcome3    -2.930e-01  1.927e-01  -1.520   0.1285    
treatment2   8.717e-16  2.000e-01   0.000   1.0000    
treatment3   4.557e-16  2.000e-01   0.000   1.0000    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

在这里我们可以看到outcome2,outcome3,但不是结果1,我希望在输出中看到(估计为0或空白)。在这个特定的例子中,显而易见的是,基准水平是结果1,但如果我正在处理变量,例如国家级别{美国,墨西哥,加拿大......},我可能不记得哪一个首先是省略。

示例输出我正在寻找:

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  3.045e+00  1.709e-01  17.815   <2e-16 ***
outcome1     0          NA         NA      NA
outcome2    -4.543e-01  2.022e-01  -2.247   0.0246 *  
outcome3    -2.930e-01  1.927e-01  -1.520   0.1285 
treatment1   0          NA         NA       NA   
treatment2   8.717e-16  2.000e-01   0.000   1.0000    
treatment3   4.557e-16  2.000e-01   0.000   1.0000    

0 个答案:

没有答案