我正在建立一个逻辑回归模型,使用一个带有12个不同等级(月)的因子变量的连续变量。我对按月的互动效果感兴趣。
glm(formula = PQR.dep ~ multi.month.data * Month, family = binomial,
data = training)
但是,当我查看输出时,初始因子值(1月)似乎是隐含的。
我如何1)明确显示该因子的值,或2)确定系数和Pr(> | z |)是什么?
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.32310 0.16057 -8.24 <0.0000000000000002 ***
multi.month.data -0.08626 0.39769 -0.22 0.83
Month02Feb 0.05221 0.22231 0.23 0.81
Month03Mar -0.17425 0.22824 -0.76 0.45
Month04Apr 0.06336 0.22680 0.28 0.78
.
.
.
Month12Dec 0.05221 0.22231 0.23 0.81
multi.month.data:Month02Feb 0.49568 0.51903 0.96 0.34
multi.month.data:Month03Mar 0.44301 0.57446 0.77 0.44
multi.month.data:Month04Apr 0.88472 0.60063 1.47 0.14
.
.
.
multi.month.data:Month12Dec 0.88472 0.60063 1.47 0.14
在上面的例子中,我如何确定Month01Jan和multi.month.data:Month01Jan的值?
答案 0 :(得分:1)
当你有一个因子时,R假设其中一个级别(在这种情况下是Month01Jan
)具有系数而Pr(> | z |)为0.您在输出中看到的可以是被认为是给定月份与Month01Jan
相比的影响。同样,该月的交互项也是0。
答案 1 :(得分:0)
如果你回到逻辑回归基础知识,有可能只使用截距和最低类别中受试者的比例构建基线水平概率(月= 1月)的估计值,但是使用R,它是更容易使用predict
函数。
mod1 <- glm(formula = PQR.dep ~ multi.month.data * Month,
family = binomial, data = training)
predict(mod1,
newdata=data.frame(Month=`01Jan`,
multi.month.data = with(training,
seq(min(multi.month.data),
max(multi.month.data),
length=10))
type="response" )
(我正在根据您对基线'月'水平的价值进行有根据的猜测,)