Stata回归后,Stata识别有影响的观察结果

时间:2020-07-08 23:25:48

标签: stata survey outliers

使用Stata svy命令时,例如:

svy: logistic graduate age female i.math i.english

有许多应完成的后续步骤。例如,寻找明显的异常值或高杠杆点。没有'svy'元素,以下命令将起作用:

predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)

但是,使用svy前言运行逻辑回归时,只会产生以下错误:

svy估算后不允许使用选项rstandard

太好了。允许什么?有人如何看待明显的离群点或高杠杆点?

1 个答案:

答案 0 :(得分:1)

@NickCox在他的评论中是正确的-将诊断扩展到复杂的调查设置并没有做太多的工作。原因之一是,从技术上讲,调查推断不是参数性的:推断的对象不是变量之间的某种理想化关系,而是普查回归,以及全部人口可能具有的所有“异常值”。不可能受到异常值的严重影响;只是估计方程式,而且标准误差无论如何都是“稳健的”(即使用三明治公式而不是Hessian。)

目前的工作大部分是由里克·瓦利安(Rick Valliant)完成的(R软件包svydiagshttps://cran.r-project.org/web/packages/svydiags/,他的学生李建柱的论文:https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y;有一些后续论文发表了从那篇论文中我马上找不到。)

(这更像是对CrossValidated / stats的讨论,而不是对SO / Stata的讨论。)