Question

我有一个网格，其中包含我想用插值填充的间隙（NAs）。我的网格显示x和y维度的自相关，所以我想尝试双线性插值。我发现的大部分解决方案都集中在“上采样”和“采样”上。（插值用于增加样本数/网格大小），但我不想/需要更改网格大小。我只是想用插值填充NA。其他可能的解决方案do not seem to handle NAs for the input grid of values (the 'z matrix')，或neighborhood-based solutions而不是双线性插值，或简称为have no answer。

我发现使用光栅包，我可以输入一个包含NA的网格（作为栅格），然后使用＆＃39; resample＆＃39;命令输出相同大小的网格。但是，结果看起来像最近邻插值而不是双线性插值。

我是否遗漏了一些方法，使用光栅包进行双线性插值？或者是否有更好的方法来完成双线性插值以填充NA？

library(raster)

# raster containing gap
r <- raster(nrow=10, ncol=10)
r[] <- 1:ncell(r)
r[25] <- NA

# The s raster is the same size as the r raster
s <- raster(nrow=10, ncol=10)
s <- resample(r, s, method='bilinear')
plot(r)
plot(s)
s[25]
s[35]
# s[25] appears to have been filled with neighbor s[35]

更新

Akima软件包似乎是上述光栅方法的一种有前途的替代方案，但如果在输入网格值（Z矩阵）中存在NA，我会遇到麻烦。这是一个与上面示例平行的示例以进行演示。（同样，我将内插到与原始尺寸相同的网格中。）

library(akima)

# Use bilinear interpolation (no NAs in input)
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # works
plot(raster(rmat), main = "original")
plot(raster(smat$z), main = "interpolated")

# Try using bilinear interpolation but with an NA
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
rmat[3,5] <- NA
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # Error about NAs

UPDATE2

@Robert Hijmans提出了一个很好的问题，即为什么不在光栅包中使用一个移动窗口平均值和focal（）命令。原因是我想尝试双线性插值，我不认为移动窗口平均值总是给出与双线性插值相同的答案。但是，在我发布的示例中并不清楚这一点（在该示例中，移动窗口和双线性interp 做给出相同的答案），因此我将在下面的新示例中进行演示。请注意，对于以下示例（here is a handy calculator for tests），双线性插值解决方案应为8。

library(raster)
r <- raster(nrow=10, ncol=10)

# Different grid values than earlier examples
values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA
plot(r)

# See what the mean of the moving window produces
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE) 
f[25] # Moving window gives 5 but bilinear interp gives 8

# Note that this seems to be how the moving window works with equal weights
window_test <- c(r[14:16], r[24:26], r[34:36])
 mean(window_test, na.rm = T)

我在这里遗漏了什么吗？也许有一些聪明的，使用focal（）的权重参数可以产生双线性插值解？

Answer 1

让我们使用等距离单元来避免因lon / lat数据的单元大小变化而产生的差异

library(raster)
r <- raster(nrow=10, ncol=10, crs='+proj=utm +zone=1 +datum=WGS84', xmn=0, xmx=1, ymn=0, ymx=1)

对于此示例，您可以使用focal

values(r) <- 1:ncell(r)
r[25] <- NA
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE)

我看到你忽视了“基于邻域的解决方案而不是双线性插入”。但问题是为什么。在这种情况下，您可能需要基于邻域的解决方案。

更新。然后，在细胞不是近似正方形的情况下，双线性将是优选的。

values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA

双线性插值的问题通常使用4个连续的单元格，但在这种情况下，您需要单元格中心的值，适当的单元格将是单元格本身的值，因为到该单元格的距离是零，因此这是插值结束的地方。例如，对于单元格23

extract(r, xyFromCell(r, 23))
#6
extract(r, xyFromCell(r, 23), method='bilinear')
#[1] 6

在这种情况下，焦点细胞是NA，因此您可以获得焦点细胞的平均值和另外3个细胞。问题是哪三个？它是任意的，但要使其工作，NA单元必须得到一个值。 raster算法将NA单元格下方的值分配给该单元格（此处也为8）。我认为，这在边缘（例如陆地/海洋）处理NA值时效果很好，但在这种情况下可能不是这样。 ` extract（r，xyFromCell（r，25）） #NA extract（r，xyFromCell（r，25），method ='bilinear'）＃[1] 8

这也是resample给出的

resample(r, r)[25]
# 8

这也是在线计算器的建议吗？

这对小变化非常敏感

extract(r, xyFromCell(r, 25)+0.0001, method='bilinear')
#[1] 4.998997

在这种情况下我真正想要的是车友的意思

mean(r[adjacent(r, 25, pairs=FALSE)])
[1] 6

或者，更一般地说，局部反距离加权平均值。你可以计算通过设置焦点

的权重矩阵

# compute weights matrix
a <- sort(adjacent(r, 25, 8, pairs=F, include=TRUE))
axy <- xyFromCell(r, a)
d <- pointDistance(axy, xyFromCell(r, 25), lonlat=F)
w <- matrix(d, 3, 3)
w[2,2] <- 0
w <- w / sum(w)

# A simpler approach could be: 
# w <- matrix(c(0,.25,0,.25,0,.25,0,.25,0), 3, 3)


foc <- focal(r, w, na.rm=TRUE, NAonly=TRUE)
foc[25]

在这个例子中，这很好;但如果焦点区域有多个NA值（因为权重之和不再是1），那就不正确了。我们可以通过计算权重之和来纠正它

x <- as.integer(r/r)
sum_weights <- focal(x, w, na.rm=TRUE, NAonly=TRUE)

fw <- foc/sum_weights
done <- cover(r, fw)
done[25]

R：填充R

1 个答案: