在spdep :: lagsarlm模型中加权观察?

时间:2015-03-05 11:40:15

标签: r statistics regression sp spdep

我想在R中估计spdep::lagsarlm模型(空间自回归回归)。我的观察(n = 447)是多边形,每个都代表柏林的行政区域。

然而,问题是这些地区的居民人数差异很大(500到32000之间)。因此,我想用每个观察者的数量对居民进行加权。使用lm这很容易,因为它接受可选参数weights= ...

如何使用spdep::lagsarlm执行类似的操作?有解决方法吗?

1 个答案:

答案 0 :(得分:4)

我没有使用spdep::lagsarlm,但使用以下方法复制lm使用权重的方式非常容易:

假设您有一个data.frame df定义为:

df <- data.frame(a=runif(10), b=runif(10))

> df
           a          b
1  0.8266429 0.43591733
2  0.4624063 0.93180891
3  0.7085656 0.36468984
4  0.3339251 0.79093356
5  0.8236406 0.39687242
6  0.8266429 0.83213817
7  0.4624063 0.34714824
8  0.7085656 0.01812133
9  0.3339251 0.54498829
10 0.8236406 0.73677156

和权重向量定义为:

c(1,1,1,1,2,2,2,2,2,2)

对上述数据运行lm会产生以下结果:

> lm(a~b, data=df, weights=c(1,1,1,1,2,2,2,2,2,2))

Call:
lm(formula = a ~ b, data = df, weights = c(1, 1, 1, 1, 2, 2, 
    2, 2, 2, 2))

Coefficients:
(Intercept)            b  
     0.6672      -0.0467  

现在让我们看看函数lm实际上如何使用权重向量。

我们首先按照权重中定义的数字复制data.frame df的行,如下所示:

replicate_rows <- rep(1:nrow(df), c(1,1,1,1,2,2,2,2,2,2))

权重为2的行显示两次,如下所示:

> replicate_rows
 [1]  1  2  3  4  5  5  6  6  7  7  8  8  9  9 10 10

使用上述方法制作一个使用这些行的新data.frame df2

df2 <- df[replicate_rows, ]

> df2
             a          b
1    0.8266429 0.43591733
2    0.4624063 0.93180891
3    0.7085656 0.36468984
4    0.3339251 0.79093356
5    0.8236406 0.39687242
5.1  0.8236406 0.39687242
6    0.8266429 0.83213817
6.1  0.8266429 0.83213817
7    0.4624063 0.34714824
7.1  0.4624063 0.34714824
8    0.7085656 0.01812133
8.1  0.7085656 0.01812133
9    0.3339251 0.54498829
9.1  0.3339251 0.54498829
10   0.8236406 0.73677156
10.1 0.8236406 0.73677156

我根据权重复制了数据帧df的行。我们现在运行lm而不使用权重:

> lm(a~b, data=df2)

Call:
lm(formula = a ~ b, data = df2)

Coefficients:
(Intercept)            b  
     0.6672      -0.0467  

正如您所看到的结果完全一样!

您可以使用以上方法相应地权衡您的data.frame,然后在spdep::lagsarlm函数中使用它。