r逻辑输出中的不完全因子交互值

时间:2013-11-05 15:18:12

标签: r

我正在建立一个逻辑回归模型,使用一个带有12个不同等级(月)的因子变量的连续变量。我对按月的互动效果感兴趣。

glm(formula = PQR.dep ~ multi.month.data * Month, family = binomial, 
data = training)

但是,当我查看输出时,初始因子值(1月)似乎是隐含的。

我如何1)明确显示该因子的值,或2)确定系数和Pr(> | z |)是什么?

Coefficients:
                           Estimate Std. Error z value            Pr(>|z|)    
(Intercept)                -1.32310    0.16057   -8.24 <0.0000000000000002 ***
multi.month.data            -0.08626    0.39769   -0.22                0.83    
Month02Feb                  0.05221    0.22231    0.23                0.81    
Month03Mar                 -0.17425    0.22824   -0.76                0.45    
Month04Apr                  0.06336    0.22680    0.28                0.78    
.
.
.  
Month12Dec                   0.05221    0.22231    0.23                0.81
multi.month.data:Month02Feb  0.49568    0.51903    0.96                0.34    
multi.month.data:Month03Mar  0.44301    0.57446    0.77                0.44    
multi.month.data:Month04Apr  0.88472    0.60063    1.47                0.14    
.
.
.  
multi.month.data:Month12Dec  0.88472    0.60063    1.47                0.14

在上面的例子中,我如何确定Month01Jan和multi.month.data:Month01Jan的值?

2 个答案:

答案 0 :(得分:1)

当你有一个因子时,R假设其中一个级别(在这种情况下是Month01Jan)具有系数而Pr(> | z |)为0.您在输出中看到的可以是被认为是给定月份与Month01Jan相比的影响。同样,该月的交互项也是0。

答案 1 :(得分:0)

如果你回到逻辑回归基础知识,有可能只使用截距和最低类别中受试者的比例构建基线水平概率(月= 1月)的估计值,但是使用R,它是更容易使用predict函数。

mod1 <- glm(formula = PQR.dep ~ multi.month.data * Month, 
                  family = binomial, data = training)
predict(mod1, 
       newdata=data.frame(Month=`01Jan`, 
                        multi.month.data = with(training,
                                         seq(min(multi.month.data), 
                                             max(multi.month.data),
                                             length=10))
         type="response" )

(我正在根据您对基线'月'水平的价值进行有根据的猜测,)