我正在对某些数据进行logit回归。我的因变量是二元的,除了我的一个独立变量外 当我运行回归时,stata会丢弃许多自变量并给出错误:
“变量名称”!= 0完全预测失败 “变量名称”丢弃,“数字”未使用
我知道一些事实,即一些变量丢失并不能完美地预测失败。换句话说,因变量可以取值1作为自变量的值1或0。
为什么会发生这种情况,我该如何解决?
答案 0 :(得分:3)
双变量交叉制表没有显示问题。试试这个:
http://www.stata.com/support/faqs/statistics/completely-determined-in-logistic-regression/index.html
首先确认这是正在发生的[共线]。 (对于您的数据,将x1和x2替换为模型的自变量。)
数字协变量模式:
egen pattern = group(x1 x2)
识别只有一个结果的模式:
logit y x1 x2 预测p 总结p
完全预测结果的协变量模式可能对研究人员有意义,或者由于模型中有许多变量而可能是异常。
现在你必须摆脱共线性:
logit y x1 x2 if pattern~ = XXXX //(使用选项卡步骤中的值)
重新删除共线性的模型:
logit y x1
您可能想要也可能不想要包含完美预测结果的协变量模式。这取决于(3)的答案。如果完全预测结果的协变量模式是有意义的,您可能希望从模型中排除这些观察结果:
logit y x1 if pattern ~= XXXX
这里有人报告
协变量模式这样和预测结果完美 其余数据的最佳模型是.... xyz