Question

我正在建立一个逻辑回归模型，使用一个带有12个不同等级（月）的因子变量的连续变量。我对按月的互动效果感兴趣。

glm(formula = PQR.dep ~ multi.month.data * Month, family = binomial, 
data = training)

但是，当我查看输出时，初始因子值（1月）似乎是隐含的。

我如何1）明确显示该因子的值，或2）确定系数和Pr（＆gt; | z |）是什么？

Coefficients:
                           Estimate Std. Error z value            Pr(>|z|)    
(Intercept)                -1.32310    0.16057   -8.24 <0.0000000000000002 ***
multi.month.data            -0.08626    0.39769   -0.22                0.83    
Month02Feb                  0.05221    0.22231    0.23                0.81    
Month03Mar                 -0.17425    0.22824   -0.76                0.45    
Month04Apr                  0.06336    0.22680    0.28                0.78    
.
.
.  
Month12Dec                   0.05221    0.22231    0.23                0.81
multi.month.data:Month02Feb  0.49568    0.51903    0.96                0.34    
multi.month.data:Month03Mar  0.44301    0.57446    0.77                0.44    
multi.month.data:Month04Apr  0.88472    0.60063    1.47                0.14    
.
.
.  
multi.month.data:Month12Dec  0.88472    0.60063    1.47                0.14

在上面的例子中，我如何确定Month01Jan和multi.month.data:Month01Jan的值？

Answer 1

当你有一个因子时，R假设其中一个级别（在这种情况下是Month01Jan）具有系数而Pr（> | z |）为0.您在输出中看到的可以是被认为是给定月份与Month01Jan相比的影响。同样，该月的交互项也是0。

Answer 2

如果你回到逻辑回归基础知识，有可能只使用截距和最低类别中受试者的比例构建基线水平概率（月= 1月）的估计值，但是使用R，它是更容易使用predict函数。

mod1 <- glm(formula = PQR.dep ~ multi.month.data * Month, 
                  family = binomial, data = training)
predict(mod1, 
       newdata=data.frame(Month=`01Jan`, 
                        multi.month.data = with(training,
                                         seq(min(multi.month.data), 
                                             max(multi.month.data),
                                             length=10))
         type="response" )

（我正在根据您对基线'月'水平的价值进行有根据的猜测，）

r逻辑输出中的不完全因子交互值

2 个答案: