如何解释数据的线性回归假设

时间:2020-03-06 05:36:00

标签: r olsmultiplelinearregression

我有一个包含9719个特征的3719观测值的数据集。在这种情况下,我对选定的特征执行了多个线性回归。 我得到了这样的诊断图:

this

我通过图了解到因变量和自变量之间没有线性关系,剩余图给出了非线性趋势。但是从正态Q-Q曲线来看,它遵循正态分布。我没有得到剩余vs杠杆图的含义是什么?

我理解正确吗?如何解释这些情节。

1 个答案:

答案 0 :(得分:0)

您的残差显示出异方差性(左上方),这意味着结果的可变性随结果的值而增加。例如,收入与支出之间的关系:较富裕的人购买的食物价格具有更大的可变性(他们有时购买廉价食物,有时购买昂贵的食物),而较贫穷的人则倾向于只购买廉价食物。

QQ图(左下图)评估了残差假设的正态性,但我认为没有任何迹象表明存在严重的违规情况。右上角的轻微偏离并不像您的异方差问题那么严重。

残差与杠杆关系图(右下)表示根据库克距离可能会对您的结果产生重大影响的点。这可以帮助您识别数据中的异常值,您可以在运行其他模型(相当主观的评估)之前考虑忽略这些异常值。