我想在R中估计spdep::lagsarlm
模型(空间自回归回归)。我的观察(n = 447)是多边形,每个都代表柏林的行政区域。
然而,问题是这些地区的居民人数差异很大(500到32000之间)。因此,我想用每个观察者的数量对居民进行加权。使用lm
这很容易,因为它接受可选参数weights=
...
如何使用spdep::lagsarlm
执行类似的操作?有解决方法吗?
答案 0 :(得分:4)
我没有使用spdep::lagsarlm
,但使用以下方法复制lm
使用权重的方式非常容易:
假设您有一个data.frame df
定义为:
df <- data.frame(a=runif(10), b=runif(10))
> df
a b
1 0.8266429 0.43591733
2 0.4624063 0.93180891
3 0.7085656 0.36468984
4 0.3339251 0.79093356
5 0.8236406 0.39687242
6 0.8266429 0.83213817
7 0.4624063 0.34714824
8 0.7085656 0.01812133
9 0.3339251 0.54498829
10 0.8236406 0.73677156
和权重向量定义为:
c(1,1,1,1,2,2,2,2,2,2)
对上述数据运行lm
会产生以下结果:
> lm(a~b, data=df, weights=c(1,1,1,1,2,2,2,2,2,2))
Call:
lm(formula = a ~ b, data = df, weights = c(1, 1, 1, 1, 2, 2,
2, 2, 2, 2))
Coefficients:
(Intercept) b
0.6672 -0.0467
现在让我们看看函数lm
实际上如何使用权重向量。
我们首先按照权重中定义的数字复制data.frame df的行,如下所示:
replicate_rows <- rep(1:nrow(df), c(1,1,1,1,2,2,2,2,2,2))
权重为2的行显示两次,如下所示:
> replicate_rows
[1] 1 2 3 4 5 5 6 6 7 7 8 8 9 9 10 10
使用上述方法制作一个使用这些行的新data.frame df2
:
df2 <- df[replicate_rows, ]
> df2
a b
1 0.8266429 0.43591733
2 0.4624063 0.93180891
3 0.7085656 0.36468984
4 0.3339251 0.79093356
5 0.8236406 0.39687242
5.1 0.8236406 0.39687242
6 0.8266429 0.83213817
6.1 0.8266429 0.83213817
7 0.4624063 0.34714824
7.1 0.4624063 0.34714824
8 0.7085656 0.01812133
8.1 0.7085656 0.01812133
9 0.3339251 0.54498829
9.1 0.3339251 0.54498829
10 0.8236406 0.73677156
10.1 0.8236406 0.73677156
我根据权重复制了数据帧df的行。我们现在运行lm
而不使用权重:
> lm(a~b, data=df2)
Call:
lm(formula = a ~ b, data = df2)
Coefficients:
(Intercept) b
0.6672 -0.0467
正如您所看到的结果完全一样!
您可以使用以上方法相应地权衡您的data.frame,然后在spdep::lagsarlm
函数中使用它。