使用Stata svy命令时,例如:
svy: logistic graduate age female i.math i.english
有许多应完成的后续步骤。例如,寻找明显的异常值或高杠杆点。没有'svy'元素,以下命令将起作用:
predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)
但是,使用svy
前言运行逻辑回归时,只会产生以下错误:
svy估算后不允许使用选项rstandard
太好了。允许什么?有人如何看待明显的离群点或高杠杆点?
答案 0 :(得分:1)
@NickCox在他的评论中是正确的-将诊断扩展到复杂的调查设置并没有做太多的工作。原因之一是,从技术上讲,调查推断不是参数性的:推断的对象不是变量之间的某种理想化关系,而是普查回归,以及全部人口可能具有的所有“异常值”。不可能受到异常值的严重影响;只是估计方程式,而且标准误差无论如何都是“稳健的”(即使用三明治公式而不是Hessian。)
目前的工作大部分是由里克·瓦利安(Rick Valliant)完成的(R软件包svydiags
:https://cran.r-project.org/web/packages/svydiags/,他的学生李建柱的论文:https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y;有一些后续论文发表了从那篇论文中我马上找不到。)
(这更像是对CrossValidated / stats的讨论,而不是对SO / Stata的讨论。)