MATLAB fitlm:OLS vs Robust regression

时间:2017-09-22 20:08:40

标签: matlab linear-regression least-squares

我正在尝试使用MATLAB的fitlm工具计算一些数据的线性回归。使用普通最小二乘法(OLS),我得到相当低的R平方值(~0.2-0.5),有时甚至是不切实际的结果。然而,当使用稳健回归(特别是' talwar'选项)时,我得到了更好的结果(R2~0.7-0.8)。

我不是统计学家,所以我的问题是:我有什么理由相信强大的结果更好?

以下是一些数据的示例。显示的数据产生OLS的R2:0.56,稳健:0.72。

enter image description here

2 个答案:

答案 0 :(得分:1)

你将在R值中获得显着差异的一个原因是Talwar处理异常值的方式不同。 Talwar将您的数据集细分为细分,并计算每个细分的平均值。

摘自Talwar的论文摘要:

'线性模型参数的估计通常是通过普通最小二乘法(OLS)获得的,它对加性误差项的大值敏感...我们得到一个简单,一致和渐近正态系数的初始估计,保护分析师免受εi的大值,这些值通常很难在具有许多回归量的模型上使用OLS检测到。 ' - https://www.jstor.org/stable/2285386?seq=1#page_scan_tab_contents

Talwar或OLS是否更好取决于您对测量过程的了解(即,如何解释异常值)。如果合适,您通过Q测试修剪数据以删除异常值(请参阅http://education.mrsec.wisc.edu/research/topic_guides/outlier_handout.pdf),这应该最小化您在Talwar和OLS之间看到的R的差​​异。

答案 1 :(得分:0)

当然可以。健壮回归的概念非常广泛。有不同类型的稳健回归。因此,存在一种情况,一种鲁棒回归的性能优于其他鲁棒回归方法。