我有三个问题:
线性回归中空间自相关的问题是什么?
为什么可以通过混合线性模型解决?
下面的模型实现是否正确?或者我是否需要添加相关结构?
我有以下空间 - 时间数据集,我想找出哪些估算变量(生物8,9,16,17)在解释生产方面具有重要意义:
> head(RegrInput)
DistrID Year Production bio8 bio9 bio16 bio17
1 1 1982 1433.833 0.17695395 0.00240241 -18.73348 24.933607
2 1 1983 1151.877 -0.06570671 -0.56608232 19.08482 12.682994
3 1 1984 1317.626 0.48731404 0.64346423 -113.17526 -33.892477
...
有65个区(DistrID)和34年。问题是估计量在空间上是自相关的。所以,它们在邻近地区会相似。我听说在这种情况下,线性模型的p值
lm(Production ~ bio8 + bio9...)
无法信任。我听说像
这样的混合线性模型lme(Production ~ bio8 + bio9...,random=~1|DistrID)
可以解决此问题。
我知道空间自相关违反了观测的线性独立性。我还看到这样的观察结果不会产生正态分布的残差。因此,违反了线性回归的两个主要假设。但也许有人可以提供一些基本的说明性参考或简单解释为什么这是一个问题以及如何通过这里的混合模型解决它。
那会非常好。非常感谢!
菲利克斯