我正在使用全局列表方法在Stata中进行简单的Tobit回归。但是,我只能得到Pseudo R2,我想知道如何获得R2。我在其他论文中已经看到了这一点,其中作者在结果表中包括R2和伪R2。
这是我在Stata中用于执行Tobit回归的命令:
tobit $ylist $xlist, ll(0)
这就是我得到的回归结果:
Tobit regression Number of obs = 720
LR chi2(11) = 634.77
Prob > chi2 = 0.0000
Log likelihood = -1069.1367 Pseudo R2 = 0.2289
------------------------------------------------------------------------------
lnFDI | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lnEPUex | .2463733 .1107293 2.23 0.026 .0289769 .4637698
lngex | 2.105098 .2226805 9.45 0.000 1.667906 2.54229
lngim | .2139065 .0572308 3.74 0.000 .1015444 .3262685
rlnPIex | .3114163 .0572274 5.44 0.000 .1990609 .4237717
rlnPIim | .1422837 .0532301 2.67 0.008 .0377763 .2467912
rln_GDP | -.0225078 .0067543 -3.33 0.001 -.0357686 -.009247
rln_pu | -.0731599 .0080628 -9.07 0.000 -.0889897 -.05733
lnreedim | 4.846298 .4855235 9.98 0.000 3.893062 5.799534
lndi | -.2364755 .0507064 -4.66 0.000 -.3360282 -.1369228
bording | .0116308 .2489393 0.05 0.963 -.4771156 .5003771
opening | -.4729668 .1726833 -2.74 0.006 -.8119987 -.133935
_cons | -33.79161 2.927544 -11.54 0.000 -39.5393 -28.04392
-------------+----------------------------------------------------------------
/sigma | 1.068198 .0281495 1.012932 1.123465
------------------------------------------------------------------------------
Obs. summary: 0 left-censored observations
720 uncensored observations
0 right-censored observations
答案 0 :(得分:0)
在我看来,你有几个选择。
选项1:自己计算 R平方统计量被定义为观测值与预测值之间的平方差之和除以观测值与样本平均值之间的平方差之和。如果您观察到的结果变量为 Y ,则您的预测值为 F ,您的平均值 Yav 是在 Y 的观测值之间计算的,然后R-square定义为:Σ( Yi < / em> - Fi )^ 2 /Σ( Yi - YAV 强>)^ 2。。
解释此比率的一种方法是衡量您的预测器 F 与使用样本平均值 Yav 进行比较的程度作为预测器。
这可以在Stata中实现,具有以下内容(伪代码,需要Y的实变量名称,并且需要注意变量以获得正确的总和):
(code here to run your Tobit first)
predict, F
quietly sum Y
gen Yav=r(mean)
gen sq_res=(Y-F)^2
gen sq_tot=(Y-Yav)^2
egen SSres= sum(sq_res)
egen SStot=sum(sq_tot)
gen R-square=SSres/SStot
有更好的计算方法,例如使用Stata矩阵语言或预定义的返回标量,但此过程会向您解释您正在做什么。
选项2:使用其他更好的损失函数 R平方统计量只是一个衡量拟合度的指标,还有其他的。一般来说,它是损失函数的一种特殊形式,定义为一些 L(Y,F,Z) ,用于衡量您的预测回归值偏离观察值,其中 Y 是观察到的结果变量, F 是您的预测值,以及 Z 其他一些可能导致模型准确性降低的变量。例如,您可以定义的最简单的损失函数是 L(Y,F,Z) = Y-F 。因此,如上所示,R平方定义为R平方= L(Y,F,Yav) 。您可以看到定义的R-square不是与样本无关的度量,因为它会根据 Yav 而变化。作为工具精度的衡量标准,如果样品之间发生变化,则可能不是很好。如果您选择将R平方测量解释为XYZ解释/无法解释的变异的百分比,那么您必须依赖于样本依赖性,但如果您对Tobit的准确性感兴趣,我会建议其他人,以及其他一些函数 L(Y,F) 将具有与样本无关的属性。我在这里要注意的是,虽然每个人都使用平方偏差作为习惯,但他们往往对异常值敏感。绝对偏差不会,所以你可以考虑。
选项3:使用以前的文献 如果您的措施表现不佳,那么在满足的情况下提出自己的损失函数可能会让您陷入困境。您可以使用其他人设计的损失函数。例如,Elliott和Timmermann(2016)给出了一个综合处理,以及许多表现良好的函数的例子,包括平均绝对误差损失函数,分段线性损失函数和二元结果的损失函数,例如Kuipers得分。 Artis和Marcellino(2001),Capistrán和Timmermann(2009),Varian(1975)和Zellner(1986a)都使用了Linex(线性指数)损失函数,后者采用了更直观清晰的贝叶斯方法。
<强>参考强>
Elliott,G。和A. Timmermann。 2004.一般损失函数和预测误差分布下的最优预测组合。 Journal of Econometrics 122:47-79。
Graham Elliott,Allan Timmermann-Economic Forecasting-Princeton University Press(2016),第2章,第13-37页Artis,M。和M. Marcellino。 2001.财政预测:国际货币基金组织,经合组织和欧共体的记录。 Econometrics Journal 4:20-36。
Capistrán,C。和A. Timmermann。 2009.与专家进出的预测组合。商业杂志经济统计27:428-40。
Varian,H.R。1975.贝叶斯房地产评估方法。研究贝叶斯计量经济学和统计学,以纪念Leonard J. Savage 195-208。
Zellner,A。1986a。使用非对称损失函数的贝叶斯估计和预测。 Journal of the American Statistical Association 81:446-51。