在概率回归中预测和乘法变量/交互项

时间:2013-06-23 16:39:07

标签: r glm predict

我想确定每个因变量在概率回归中的边际效应如下:

  • 用每个变量的平均值预测(基数)概率
  • 对于每个变量,如果变量取值为变量的平均值+ 1x标准差,则预测与基本概率相比的概率变化

在我的一个回归中,我有一个乘法变量,如下所示:

my_probit <- glm(a ~ b + c + I(b*c), family = binomial(link = "probit"), data=data)

两个问题:

  1. 当我使用上述方法确定边际效应时,乘法项的值是否会反映b或c的值取值变量的平均值+ 1x标准差?
  2. 同样的问题,但有一个互动词(*和没有I())而不是乘法词。
  3. 非常感谢

1 个答案:

答案 0 :(得分:4)

在解释涉及交互项的模型的结果时,一般规则是不要解释系数。相互作用的存在意味着术语系数的含义将根据用于预测的其他变量值而变化。查看结果的正确方法是构建“预测网格”,即在感兴趣的范围内间隔开的一组值(希望在数据支持的范围内)。此过程的两个基本功能是expand.gridpredict

dgrid <- expand.grid(b=fivenum(data$b)[2:4], c=fivenum(data$c)[2:4]
# A grid with the upper and lower hinges and the medians for `a` and `b`.

predict(my_probit,  newdata=dgrid)

您可能希望在默认值以外的范围内进行预测(即返回线性预测值),因此如果是这样,可能会更容易解释:

predict(my_probit,  newdata=dgrid, type ="response")

请务必阅读?predict?predict.glm并使用一些简单示例,以确保您获得了预期目标。

含有相互作用的模型(至少涉及2个协变量的模型)的预测应该被认为是三维的表面或二维流形。 (并且将3-covariate相互作用视为等值包络。)非相互作用模型可以分解为单独的术语“效果”的原因是平面预测表面的斜率在所有输入级别上保持不变。交互不是这种情况,特别是那些具有乘法和非线性模型结构的交互。在微分方程式过程中提取的图形工具和见解可以在这里高效地应用。