这是火车数据集的头。
运行以下代码:
logit = sm.GLM(Y_train, X_train, family=sm.families.Binomial())
result = logit.fit()
可以帮忙吗?
出现以下错误: Error Screen Shot
答案 0 :(得分:0)
Python已在一个或多个预测变量和结果变量中检测到完全或准完全分离。
当一个预测变量类别(或多个预测变量组合)中的所有或几乎所有值仅与二进制结果值之一相关联时,就会发生这种情况。 (我假设您正在尝试进行逻辑回归。)发生这种情况时,无法找到预测系数的解决方案。
有几种可能的解决方案。根据分析中有多少个变量,您可以尝试对结果和每个预测变量进行双向交叉表定位,以找到零观测值的任何单元格,然后从分析中删除该变量或使用较少的类别。另一种选择是运行Firth逻辑回归或惩罚回归。
答案 1 :(得分:0)
如果重新运行logit模型,则会出现相同的错误。 尝试重新启动并运行您的logit模型。为我工作。