具有多个变量的Excel多项式回归

时间:2016-09-05 09:06:32

标签: excel regression

我在网上看了很多关于如何在Excel和多元回归上使用多项式回归的教程,但没有一篇解释如何处理多变量和多元回归。

this image中,左栏包含我的所有变量X1,X2,X3,X4(比如它们是汽车的特征),而Y1是我要找的汽车的价格。

我从运行具有各种X1,X2,X3,X4值的模型得到了大约5000行数据,我希望进行回归,这样我就可以得到我模型的最佳估计而不必运行它(节省宝贵的计算时间)。

到目前为止,我已经设法使用Excel中的数据分析包进行多次线性回归,只需使用X1,X2,X3,X4。然而我注意到回归在某些地方看起来非常混乱和不准确,这是因为我的变量X1,X2,X3,X4非线性地影响了我的输出Y1。

我在网上查看并添加了多项式,教程建议添加一个X ^ 2列。但是当我这样做时(见图表右侧部分),我的回归比使用线性拟合要差得多。

我知道多项式可以过度拟合数据,但我使用二次形式是安全的,因为回归只需要返回系数0来忽略任何多余的多项式阶数。

非常欢迎任何帮助,

有关信息,我得到一个adujsted-R ^ 2,线性拟合为0.91,当我添加几个X ^ 2列时为0.66。

到目前为止,这是我能得到的最佳回归(黑线为1:1):

enter image description here

如您所见,我想增加曲线左下角和右上角的拟合度。

0 个答案:

没有答案