SPSS和统计模型中逻辑回归的不同p值

时间:2020-01-11 22:07:47

标签: python statistics statsmodels spss

我试图使用statsmodel在Python中进行单变量分析(二进制逻辑回归,每次都有一个特征),以计算不同特征的p值。

for f_col in f_cols:
    model = sm.Logit(y,df[f_col].astype(float))
    result = model.fit()
    features.append(str(result.pvalues).split('   ')[0])
    pvals.append(str(result.pvalues).split('   ')[1].split('\n')[0])

df_pvals = pd.DataFrame(list(zip(features, pvals)), 
           columns =['features', 'pvals']) 
df_pvals

但是,SPSS中的结果不同。 NYHA方法中sm.Logit的p值为0。所有p值都不同。 enter image description here

  1. 在statsmodel中使用sm.Logit进行二进制逻辑回归是否正确?
  2. 为什么结果之间有差异?可能sm.Logit使用L1正则化吗?
  3. 我应该怎么弄?

非常感谢!

1 个答案:

答案 0 :(得分:0)

SPSS回归建模过程会自动包括常数或截距项,除非被告知不要这样做。正如Josef所提到的,statsmodels似乎要求您显式添加一个拦截器。

相关问题