我们试图评估向具有CD帐户的人出售个人贷款的机会。因此,在我们的数据库中,我们有两个变量都不同的观察结果。
我用两个二项式变量拟合逻辑回归。一切正常,但我无法理解截距及其大小的可变系数的含义...
log_mod = sm.Logit(bin_df['Personal Loan'], bin_df[['intercept', 'CD Account']]).fit()
log_mod.summary()
这就是我得到的:
coef std err z P>|z| [0.025 0.975]
intercept -2.5508 0.056 -45.301 0.000 -2.661 -2.440
CD Account 2.4049 0.128 18.730 0.000 2.153 2.657
CD帐户的赔率是:
np.exp(log_mod.params[1])
11.076978939724048
如何解释负面拦截?
如何解释这么大的几率?我能说什么?