局部比例赔率模型中的平均边际效应(AMEs)

时间:2018-11-13 15:36:06

标签: r

如何在偏比例赔率模型(PPOM)中获得每个类别/阈值的平均边际效应(AMEs)?

这是我在该论坛上的第一篇文章。我希望我听了提出好问题的最基本建议。

此样本数据集由序数结果变量(Y1)和三个自变量(VAR1,VAR2,VAR3)组成。

set.seed(3)
sampleData <- data.frame(id = 1:1000, Y1 = sample(c("1", "2", "3", "4"), 
    1000, replace=TRUE), Var1 = rnorm(1000, 40, 10), 
    Var2 = rnorm(1000, 60, 10), Var3 = rnorm(1000, 80, 5))

假设违反比例赔率假设,则可以使用软件包ordinal来执行部分比例赔率模型(PPOM),以通过三个自变量(Var1,Var2,Var3)预测Y1。

library(ordinal)  
PPOM <- clm(as.factor(Y1) ~ Var1 + Var2 + Var3, 
        nominal = ~ Var1 + Var2 + Var3, data = sampleData)

我们得到以下输出以及每个类别的系数:

summary(PPOM)

formula: as.factor(Y1) ~ Var1 + Var2 + Var3
nominal: ~Var1 + Var2 + Var3
data:    sampleData

 link  threshold nobs logLik   AIC     niter max.grad cond.H 
 logit flexible  1000 -1381.17 2786.34 4(0)  2.82e-10 2.2e+07

Coefficients: (3 not defined because of singularities)
     Estimate Std. Error z value Pr(>|z|)
Var1       NA         NA      NA       NA
Var2       NA         NA      NA       NA
Var3       NA         NA      NA       NA

Threshold coefficients:
                  Estimate Std. Error z value
1|2.(Intercept)  0.4952642  1.2260010   0.404
2|3.(Intercept)  1.9790234  1.0724982   1.845
3|4.(Intercept)  2.0892425  1.2550636   1.665
1|2.Var1         0.0026194  0.0075920   0.345
2|3.Var1        -0.0077578  0.0065845  -1.178
3|4.Var1        -0.0064243  0.0075364  -0.852
1|2.Var2        -0.0001089  0.0074568  -0.015
2|3.Var2        -0.0082836  0.0063447  -1.306
3|4.Var2        -0.0073638  0.0071008  -1.037
1|2.Var3        -0.0219767  0.0140701  -1.562
2|3.Var3        -0.0157235  0.0121943  -1.289
3|4.Var3        -0.0047098  0.0141844  -0.332

我对每个类别的每个预测变量的AMEs都很感兴趣。通过使用margins,我只能获得所有阈值的AME。

library(margins) 
summary(margins(PPOM))

输出:

 factor    AME     SE      z      p   lower  upper
   Var1 0.0000 0.0000 1.1365 0.2557 -0.0000 0.0001
   Var2 0.0000 0.0000 1.3056 0.1917 -0.0000 0.0001
   Var3 0.0001 0.0001 0.9990 0.3178 -0.0001 0.0002

有人知道如何为每个类别计算AMEs吗?

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

我知道我来晚了,但是我只是编写了一个简短(效率低下)的程序来手动计算此类模型的平均边际效应。

部分成比例的赔率序数logit / probit的平均边际效应的计算方法与对正常序数的logit / probit相同。以下是Cameron和Trivedi的“微观计量经济学:方法和应用”的摘录。连续变量的边际效应由靠近屏幕底部的方程式给出。离散变量的边际效应为Pr(y_i = j | x = 1)-Pr(y_i = j | x = 0);在页面顶部的等式中给出了Pr(y_i = j)。

我建议手动计算每组估计的beta的边际效应。这涉及保存由数据,不同的beta和计算ME的变量的系数组成的矩阵/向量。这也意味着您要为每个结果和每个系数计算一个不同的ME(在您的情况下,为3 *顺序结果的数量)。

下面是我自己编写的一些代码。它效率不高,并且会一一列举。它根据三个结果计算一个称为“ snap12”的虚拟变量的ME,这就是为什么有六个方程式的原因。 “ Cut1”和“ Cut2”是截止点(在ME方程中通常称为alpha)。 Xdat是数据,不包括我要为其计算ME的变量。 xcoef1是第一组系数(减去ME变量),xcoef2是第二组系数。 Snapcoef1和snapcoef2是ME变量的系数。最后,pnorm给出CDF值,这是序数概率Pro所必需的。

我希望这对某人有帮助!



##for pr(v low secure)

#1st set of coefficients
p3a = ((1 - pnorm(cut2 - xdat%*%xcoef1 - snapcoef1)) - 
       (1 - pnorm(cut2 - xdat%*%xcoef1)))
#2nd set
p3b = ((1 - pnorm(cut2 - xdat%*%xcoef2 - snapcoef2)) - 
       (1 - pnorm(cut2 - xdat%*%xcoef2)))

#for pr(low sec)
#1st set
p2a = (pnorm(cut2 - xdat%*%xcoef1 - snapcoef1) - pnorm(cut1 - xdat%*%xcoef1 - snapcoef1)) - 
         (pnorm(cut2 - xdat%*%xcoef1) - pnorm(cut1 - xdat%*%xcoef1))

p2b = (pnorm(cut2 - xdat%*%xcoef2 - snapcoef2) - pnorm(cut1 - xdat%*%xcoef2 - snapcoef2)) - 
  (pnorm(cut2 - xdat%*%xcoef2) - pnorm(cut1 - xdat%*%xcoef2))

## for pr(fodo sec)

p1a = (pnorm(cut1 - xdat%*%xcoef1 - snapcoef1)) - (pnorm(cut1 - xdat%*%xcoef1))

p1b = (pnorm(cut1 - xdat%*%xcoef2 - snapcoef2)) - (pnorm(cut1 - xdat%*%xcoef2))