我有5个变量y, x_1, x_2, x_3, x_4
的时间序列观察,其任务是找出哪个x
es负责y
中的变化。现在问题是所有这些都是强相互关联的并且表现出共线性。 x_1, x_2, x_3, x_4
内部没有隐藏的组件,它们是成对的或以任何其他方式共同的 - 它们只是自然相关。
可以预见的是,线性回归给出了不合理的结果,其中系数在去除其中一个变量后变化很大,这是高共线数据的正常图像。
正如wiki所述,多重共线性的一些补救措施是使用岭回归和主成分回归。但是,当我使用lm.ridge
方法时,它给出了与lm
完全相同的系数。
在这种情况下PCR可以帮助吗?如果是这样,在R中检索系数和p值的简单方法是什么?类似lm
函数的汇总表。
答案 0 :(得分:6)