分析R中的相关数据:线性,岭回归,PCR

时间:2012-09-24 22:33:34

标签: r statistics regression linear-regression

我有5个变量y, x_1, x_2, x_3, x_4的时间序列观察,其任务是找出哪个x es负责y中的变化。现在问题是所有这些都是强相互关联的并且表现出共线性。 x_1, x_2, x_3, x_4内部没有隐藏的组件,它们是成对的或以任何其他方式共同的 - 它们只是自然相关。

可以预见的是,线性回归给出了不合理的结果,其中系数在去除其中一个变量后变化很大,这是高共线数据的正常图像。

正如wiki所述,多重共线性的一些补救措施是使用岭回归和主成分回归。但是,当我使用lm.ridge方法时,它给出了与lm完全相同的系数。

在这种情况下PCR可以帮助吗?如果是这样,在R中检索系数和p值的简单方法是什么?类似lm函数的汇总表。

1 个答案:

答案 0 :(得分:6)

看看

  

Dormann等。 (2012年)。共线性:对待处理方法的回顾   它和评估其性能的模拟研究。   paywallalternative link

审查可用方法。

R代码和数据可用here:)