即使变量之间的相关性不是1或-1,Stata也会丢弃“预测故障完整性”的变量?

时间:2017-06-05 14:49:41

标签: regression stata logistic-regression

我正在对某些数据进行logit回归。我的因变量是二元的,除了我的一个独立变量外 当我运行回归时,stata会丢弃许多自变量并给出错误:

  

“变量名称”!= 0完全预测失败   “变量名称”丢弃,“数字”未使用

我知道一些事实,即一些变量丢失并不能完美地预测失败。换句话说,因变量可以取值1作为自变量的值1或0。

为什么会发生这种情况,我该如何解决?

1 个答案:

答案 0 :(得分:3)

双变量交叉制表没有显示问题。试试这个:

http://www.stata.com/support/faqs/statistics/completely-determined-in-logistic-regression/index.html

首先确认这是正在发生的[共线]。 (对于您的数据,将x1和x2替换为模型的自变量。)

  1. 数字协变量模式:

    egen pattern = group(x1 x2)

  2. 识别只有一个结果的模式:

    logit y x1 x2  预测p  总结p

    • p的极值几乎为0或接近1 如果p<标签模式1e-7 //(使用稍大于min的值)
    • 或在上述使用中“如果p> 1 - 1e-7”,如果p几乎为1 list x1 x2 if pattern == XXXX //(使用选项卡步骤中的值)
    • 以上标识了协变量模式
  3. 完全预测结果的协变量模式可能对研究人员有意义,或者由于模型中有许多变量而可能是异常。

  4. 现在你必须摆脱共线性:

    logit y x1 x2 if pattern~ = XXXX //(使用选项卡步骤中的值)

    • 请注意,存在共线性 *您可以省略logit丢弃或丢弃另一个的变量。
  5. 重新删除共线性的模型:

    logit y x1

  6. 您可能想要也可能不想要包含完美预测结果的协变量模式。这取决于(3)的答案。如果完全预测结果的协变量模式是有意义的,您可能希望从模型中排除这些观察结果:

     logit y x1 if pattern ~= XXXX
    

    这里有人报告

    协变量模式这样和预测结果完美 其余数据的最佳模型是.... xyz