我想测试我的线性回归模型的所有假设是否成立。我手动完成这个,看起来很好。但是,我想用函数gvlma仔细检查。我得到的输出是:
gvlma(x = m_lag)
Value p-value Decision
Global Stat 82.475 0.00000 Assumptions NOT satisfied!
Skewness 72.378 0.00000 Assumptions NOT satisfied!
Kurtosis 1.040 0.30778 Assumptions acceptable.
Link Function 6.029 0.01407 Assumptions NOT satisfied!
Heteroscedasticity 3.027 0.08187 Assumptions acceptable.
我的问题是:
如何解读Global Stat
由于违反了这个假设,我现在可以做些什么呢? (与其他2项未被接受的假设相同)
答案 0 :(得分:7)
全局统计 - 您的X预测变量与Y之间的关系是否大致呈线性关系?拒绝零(p <.05)表示一个或多个X和Y之间的非线性关系
歪斜 - 你的分布是正面还是负面地倾斜,需要转变以满足正常假设?拒绝空(p <.05)表示您可能会转换数据。
Kurtosis-您的分布是kurtotic(高峰还是非常浅峰),需要进行转换才能满足正常假设?拒绝空(p <.05)表示您可能会转换数据。
链接功能 - 您的因变量是真正连续的还是绝对的?拒绝零(p <.05)表示您应该使用广义线性模型的替代形式(例如逻辑或二项式回归)。
异方差性 - 模型残差的方差是否在X的范围内是恒定的(假设为同位数)?拒绝零(p <.05)表明你的残差是异方差的,因此在X的范围内是不恒定的。你的模型在预测你的X尺度的某些范围时更好/更差。
< / LI> 醇>答案 1 :(得分:6)
我知道这个问题是很久以前写的,但是唯一的答案并不是很准确。
基于Pena和Slate(2010),线性回归的四个假设是正态性,异方差和线性,以及作者所说的不相关性。
对于假设“不相关”,我通常将其称为独立性。作者将独立性称为通过对不相关性和正态性的组合评估来验证的一种度量。作者还提到了其他学者,他们指出这是残差的独立性(在第342页的左侧)。
1)全球统计 这是整体指标;这说明了模型整体上是通过还是失败。
2)偏度<-测量分布
3)峰度<-测量分布,离群值,有影响力的数据等
4)链接功能<-错误指定的模型,如何在模型分配中链接元素
5)异方差<-寻找残差的均方差
这些测量值并非特别偏斜,峰度等;如果您仔细观察这些措施背后的数学原理。这些指标是来自多种统计分析方法的数学推导。在他们的研究中,作者发现,当将这四个测量值结合在一起时,它不仅可以准确地评估线性回归的四个假设,而且可以对残差的假设进行交互。
为了确定首先要解决的问题,有必要知道您正在使用什么数据,样本数量以及已建立的模型。偏度的高值可能来自分布,方差等。基于Pena和Slate的原始工作,有一些需要寻找的东西,但是如果您的样本量较大或较小,它可能会急剧变化。你先来。我不能完全确定本文中的所有结论。
Pena,E.A。和Slate,E.H。(2006)。线性模型假设的全局验证。 美国统计协会杂志,第101 (473),第341-354页。 https://doi.org/10.1198/016214505000000637