4阶和5阶多项式回归无法在Excel中工作

时间:2015-04-09 12:55:11

标签: excel regression polynomials trendline

我在Excel中进行多项式回归时有一个奇怪的问题。正如之前许多人所做的那样,我试图获得Excel在图形上创建多项式趋势线时使用的正确系数。我已经阅读了如何使用LINEST进行操作,并且在进行二阶和三阶回归时我能够得到与趋势线公式相匹配的答案...但是当我尝试第四或第五时,答案差异很大从Excel向我展示趋势线公式。

这里是图表中的数据以及我对五阶回归的尝试:Click for Excel Workbook

任何人对可能导致我麻烦的事情有什么想法?

谢谢!

-Jon

2 个答案:

答案 0 :(得分:2)

输出中的零值是(多)共线性的结果。来自MS功能帮助:

“...... LINEST函数检查共线性并在识别它们时从回归模型中删除任何多余的X列。删除的X列可以在LINEST输出中识别为除0 se值之外还有0个系数... 。“

对于更准确的估计,将LINEST应用于具有均值中心的x值并且后乘乘二项式系数矩阵。所以代替:

=LINEST(B2:B31,A2:A31^{1,2,3,4,5})

尝试改为:

=MMULT(LINEST(B2:B31,(A2:A31-AVERAGE(A2:A31))^{1,2,3,4,5}),IFERROR(COMBIN({5;4;3;2;1;0},{5,4,3,2,1,0})*(-AVERAGE(A2:A31))^({5;4;3;2;1;0}-{5,4,3,2,1,0}),0))

与趋势线值一致。

另见:https://newtonexcelbach.wordpress.com/2011/02/04/fitting-high-order-polynomials/(发布和评论)

答案 1 :(得分:0)

你可能过度拟合;事实上,如果您使用的是5阶多项式,我可能会说您。对于多项式高于3阶(有时甚至高于1阶!),你冒着"趋势线"将在终点射入外太空。当您超过一定程度的复杂性时,您会将模型拟合到数据点中的随机变化,而不是生成数据的基础机制。

避免问题的一种方法是使用像岭回归这样的正则化机制。 Christopher Bishop的书模式识别和机器学习对该主题进行了很好的讨论,并给出了如何规范多项式回归的一个很好的例子。

顺便说一下,我不会用Excel进行统计分析。这是一篇关于来自计算统计和数据分析期刊的Excel统计功能的文章(我第一次在另一个stackoverflow帖子上看到了这个链接;但我不记得在哪里;道歉对于没有给予适当信用的原始海报):http://www.pages.drexel.edu/~bdm25/excel2007.pdf