用于大空间自相关数据集的线性混合效应模型

时间:2017-12-11 18:18:40

标签: r linear-regression

所以,我正在处理一个大数据集(55965分)。我正在尝试运行LME计算相关性。但是R会回复我这个

  

错误:'sumLenSq:= sum(table(groups)^ 2)'= 3.13208e + 09太大了。    相关结构中的组太大或没有组?

由于我需要所有的点,所以我无法对其进行子集化。我的问题是:
我可以在功能中更改一些设置吗?
如果没有,是否还有其他具有类似功能的软件包可以运行这么大的数据集?

这是一个可重复的例子:

require(nlme)
my.data<- matrix(data = 0, nrow = 55965, ncol = 3)
my.data<- as.data.frame(my.data)
dummy <- rep(1, 55965)
my.data$dummy<- dummy
my.data$V1<- seq(780, 56744)
my.data$V2<- seq(1:55965)
my.data$X<- seq(49.708, 56013.708)
my.data$Y<-seq(-12.74094, -55977.7409)

null.model <- lme(fixed = V1~ V2, data = my.data, random = ~ 1 | dummy, method = "ML")

spatial_model <- update(null.model, correlation = corGaus(1, form = ~ X + Y), method = "ML")

1 个答案:

答案 0 :(得分:0)

由于您只为一个级别分配了分组因子,因此数据中没有组,这是错误消息报告的内容。如果您只想考虑空间自相关,而没有其他随机效应,请使用同一个包中的gls

编辑:关于建模空间自相关的两种不同方法的进一步说明:corrGauss(和其他corrSpatial类型函数)实现回归残差的空间相关模型,这与添加到基于模型的空间随机效应不同关于县/区/网格标识。