我想使用逻辑回归模型为数据集中的各种特征及其95%置信区间生成比值比或系数。
由于在sklearn logistic回归模型中无法为比值比或系数生成95%CI值,因此我开始使用statsmodel。
但是,使用包含17个伪编码分类特征和1个结果变量的非常大的数据集,我的输出中的系数没有任何标准误差-仅对几个特征具有适度的相关性(Person的r <0.45 )。
我的代码如下:
import statsmodels.api as sm
X_atr = sm.add_constant(X_atr) #add constant for intercept
logit_model = sm.Logit(y_atr, X_atr) #Create model instance
result = logit_model.fit(method = "bfgs") #Fit model
print(result.summary()) #print results