边际效应选择,边际与非线性

时间:2014-04-16 18:16:34

标签: stata margins poisson

我估计泊松回归并且想要估计我的系数的经济意义(边际效应)。

我向我建议了三种方法:

  1. margin,dydx(_all)
  2. margins,dydx(_all)atmeans
  3. poisson,irr
  4. 我想知道哪种方法最好用。

1 个答案:

答案 0 :(得分:3)

均值(#2)的边际效应通常是一个坏主意,因为均值可能对应于不具代表性的,无意义的值,特别是如果您的X包含分类变量。对于半女性和10%怀孕的人,你真的关心加成效应吗?可能不是。当计算费用昂贵时,这种ME更常用。如果您想要使用此路线,可以使用at()选项选择更合适的值。

平均边际效应(#1)为您提供预期计数的平均添加效果。

IRR选项(#3)为您提供平均值的乘法效应。

以下是医生数据的一个简单示例:

. use http://www.stata-press.com/data/r13/dollhill3, clear
(Doll and Hill (1966))

. bys smokes: sum deaths 

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 0

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
      deaths |         5        20.2    12.61745          2         31

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-> smokes = 1

    Variable |       Obs        Mean    Std. Dev.       Min        Max
-------------+--------------------------------------------------------
      deaths |         5         126    70.52659         32        206

如您所见,吸烟者群体的平均死亡人数为126人。对于不吸烟者,其死亡人数仅为20.2。

IRR:

. poisson deaths i.smokes, irr

Iteration 0:   log likelihood =  -136.6749  
Iteration 1:   log likelihood = -136.56351  
Iteration 2:   log likelihood = -136.56346  
Iteration 3:   log likelihood = -136.56346  

Poisson regression                                Number of obs   =         10
                                                  LR chi2(1)      =     426.21
                                                  Prob > chi2     =     0.0000
Log likelihood = -136.56346                       Pseudo R2       =     0.6094

------------------------------------------------------------------------------
      deaths |        IRR   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    1.smokes |   6.237624     .66857    17.08   0.000     5.055737    7.695802
       _cons |       20.2   2.009975    30.21   0.000     16.62087    24.54986
------------------------------------------------------------------------------

吸烟者的死亡人数为6.237624 * 20.2 = 126。

现在我们计算了加性效应:

. margins, dydx(smokes)

Conditional marginal effects                      Number of obs   =         10
Model VCE    : OIM

Expression   : Predicted number of events, predict()
dy/dx w.r.t. : 1.smokes

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    1.smokes |      105.8   5.407402    19.57   0.000     95.20169    116.3983
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

这表示吸烟者的死亡人数应该比不吸烟者多105.8人。 20.2 + 105.8 = 126。

在这个简单的模型中,margins, dydx(smokes) atmeans会给出相同的答案。你能明白为什么吗?