所以我使用R进行逻辑回归,但我正在使用偏移量。
mylogit <- glm(Y ~ X1 + offset(0.2*X2) + offset(0.4*X3), data = test, family = "binomial")
输出仅显示单个系数,截距和其中一个预测变量,X1。
Coefficients:
(Intercept) X1
0.5250748 0.0157259
我的问题:我如何从这个模型的每个观察中得到原始预测? 更具体地说,如果我使用预测函数,它是否包括所有特征及其系数,即使模型系数被列为仅包含截距和X1?
prob = predict(mylogit,test,type=c("response"))
我必须使用预测功能吗? “mylogit”对象是否包含我可以直接计算的任何内容? (是的,我查看了关于glm的文档,仍然感到困惑)。
谢谢你的病人。答案 0 :(得分:6)
我可以使用glm
和offset()
报告某些实验的结果。我们对predict
的调用不会显示(至少在此实验中)会给出考虑offset
的结果。相反,为此目的似乎需要summary.glm
。我开始对?glm
中的第一个例子进行了相当严格的修改(如果你确实提供了数据,那么这对你的关注更为相关,因为那时我们可以使用你需要的newdata参数来解决更多问题。 #34;测试&#34;。)
counts <- c(18,17,15,20,10,20,25,13,12)
outcome <- gl(3,1,9)
treatment <- gl(3,3)
print(d.AD <- data.frame(treatment, outcome, counts))
glm.D93 <- glm(counts ~ outcome + treatment + offset(1:9), family = poisson())
glm.D93d <- glm(counts ~ outcome + treatment , family = poisson())
> predict(glm.D93d, type="response")
1 2 3 4 5 6 7 8 9
21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 21.00000 13.33333 15.66667
> predict(glm.D93, type="response")
1 2 3 4 5 6 7 8 9
21.00000 13.33333 15.66667 21.00000 13.33333 15.66667 21.00000 13.33333 15.66667
据我所知,offset
只有在为了统计推断的目的而对NULL估计(通常为0)进行估计系数的比较时才会明显。这是由summary.glm
:
> summary(glm.D93)$coef
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.044522 0.1708987 11.963362 5.527764e-33
outcome2 -1.454255 0.2021708 -7.193203 6.328878e-13
outcome3 -2.292987 0.1927423 -11.896644 1.232021e-32
treatment2 -3.000000 0.2000000 -15.000000 7.341915e-51
treatment3 -6.000000 0.2000000 -30.000000 9.813361e-198
> summary(glm.D93d)$coef
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.044522e+00 0.1708987 1.781478e+01 5.426767e-71
outcome2 -4.542553e-01 0.2021708 -2.246889e+00 2.464711e-02
outcome3 -2.929871e-01 0.1927423 -1.520097e+00 1.284865e-01
treatment2 1.337909e-15 0.2000000 6.689547e-15 1.000000e+00
treatment3 1.421085e-15 0.2000000 7.105427e-15 1.000000e+00
偏移量仅改变参考水平(在这个受损的例子中有相当奇怪的变化),而$linear.predictors
和$fitted
对数据的拟合不受影响。我没有看到glm中的评论会影响到这一点,但?lm
中有一条评论:&#34; offset指定的偏移量不会包含在predict.lm的预测中,而是由公式中的偏移项将是。&#34;我承认我从阅读?model.offset
获得的洞察力很少。