Excel相关R ^ 2随着包含的因素的增加而减少

时间:2017-11-03 18:26:58

标签: excel regression

我使用Excel在销售和一堆变量之间运行回归。我也总是将线性方程的y轴截距设置为0。 当我用更多变量计算相关r ^ 2时,r ^ 2下降了很多。这很奇怪,因为r ^ 2应该随着包含更多变量而增加 我很确定我已经计算出常规r ^ 2,没有调整r ^ 2。 如果我没有将y截距设置为0,则r ^ 2会随着更多变量而增加。我也意识到Excel有一些功能问题,y截取设置为0,所以我一直在手动计算R ^ 2。但我使用的方程应该是正确的。 有谁知道为什么R ^ 2下降的因素更多?是因为我将y-intercept设置为0?

非常感谢你! 杰西卡

1 个答案:

答案 0 :(得分:1)

由于排除了强制拟合线穿过原点的截距项(如果我们在2D中查看一个预测器示例),您的R平方可能会下降。 IMO,你应该包括拦截术语,即使它没有为你的模型增加逻辑意义。

This链接解释得很清楚。

  

常数项部分是通过回归分析中省略预测变量来估算的。从本质上讲,它可以作为任何偏见的垃圾箱,而模型中的术语无法解释。你可以想象回归线上下浮动(通过调整常数)到残差平均值为零的点,这是残差分析的关键假设。这种浮动不是基于对常量有意义的,而是数学上产生零均值的方法。

因此,通过强制你的线穿过原点,你可能会干扰它的预测能力,从而干扰R平方。