解释缩放特征的逻辑回归系数

时间:2020-10-01 14:03:42

标签: python logistic-regression coefficients interpretation

我正在使用逻辑回归来估计足球/足球进球的可能性。我有5个功能。我的目标值为1(目标)或0(无目标)。

通常,我必须先调整特征,然后再拟合模型。我使用了MinMaxScaler,它按如下所示缩放[0-1]范围内的所有功能: X_scaled =(x-x_min)/(x_max-x_min)

我的逻辑回归模型的系数如下:

coef = [[-2.26286643 4.05722387 0.74869811 0.20538172 -0.49969841]]

我的第一个想法是第二个功能最重要,其次是第一个。总是这样吗?

我读到“换句话说,对于“第二个特征”增加一个单位,预期对数优势的变化为4.05722387。”在this site上,但是在那里,它们的特征被标准化为平均值50和一些标准偏差。

如果我不按比例缩放特征,则模型的系数如下:

coef = [[-0.04743728 0.04394143 -0.00247654 0.23769469 -0.55051824]]

现在看来,第一个功能比第二个功能更重要。我在有关我的主题的文献中读到,这确实是正确的。所以这使我迷惑了。

我的问题是:

  • 我的哪些功能最重要,什么/为什么是找到它的最佳方法?
  • 如何解释缩放系数的含义?例如。功能1的每增加1米意味着什么?我可以在MinMaxScaler中扔1米,看看结果如何,并将其用作“一个增量”吗?
  • 确实可以将最终概率计算为y = 1/(1 + exp(-fx))fx = intercept + feature1*coef1 + feature2*coef2 + ... (所有特征均已缩放)。

1 个答案:

答案 0 :(得分:0)

我的哪些功能最重要,什么是最好的方法?为什么?

查看边际效应计算的几种版本。例如,请参见overview/discussion in a blog Stata's example resources for R

如何解释换算系数的含义?例如。功能1的每增加1米意味着什么?我可以在MinMaxScaler中扔1米,看看结果如何,并将其用作“一个增量”吗?

解释取决于您计算的边际效应。当您谈论X的一个单位增加/减少概率或优势比等的变化时,只需要考虑缩放即可。

是否真的可以将最终概率计算为y = 1 /(1 + exp(-fx)),而fx =截距+ feature1 coef1 + feature2 coef2 + ...所有功能都按比例缩放)。

是的,只是特征x是按比例度量的。