我在网上看了很多关于如何在Excel和多元回归上使用多项式回归的教程,但没有一篇解释如何处理多变量和多元回归。
在中,左栏包含我的所有变量X1,X2,X3,X4(比如它们是汽车的特征),而Y1是我要找的汽车的价格。
我从运行具有各种X1,X2,X3,X4值的模型得到了大约5000行数据,我希望进行回归,这样我就可以得到我模型的最佳估计而不必运行它(节省宝贵的计算时间)。
到目前为止,我已经设法使用Excel中的数据分析包进行多次线性回归,只需使用X1,X2,X3,X4。然而我注意到回归在某些地方看起来非常混乱和不准确,这是因为我的变量X1,X2,X3,X4非线性地影响了我的输出Y1。
我在网上查看并添加了多项式,教程建议添加一个X ^ 2列。但是当我这样做时(见图表右侧部分),我的回归比使用线性拟合要差得多。
我知道多项式可以过度拟合数据,但我使用二次形式是安全的,因为回归只需要返回系数0来忽略任何多余的多项式阶数。
非常欢迎任何帮助,
有关信息,我得到一个adujsted-R ^ 2,线性拟合为0.91,当我添加几个X ^ 2列时为0.66。
到目前为止,这是我能得到的最佳回归(黑线为1:1):
如您所见,我想增加曲线左下角和右上角的拟合度。