R:填充R

时间:2018-06-16 23:23:16

标签: r interpolation geospatial

我有一个网格,其中包含我想用插值填充的间隙(NAs)。我的网格显示x和y维度的自相关,所以我想尝试双线性插值。我发现的大部分解决方案都集中在“上采样”和“采样”上。 (插值用于增加样本数/网格大小),但我不想/需要更改网格大小。我只是想用插值填充NA。其他可能的解决方案do not seem to handle NAs for the input grid of values (the 'z matrix'),或neighborhood-based solutions而不是双线性插值,或简称为have no answer

我发现使用光栅包,我可以输入一个包含NA的网格(作为栅格),然后使用' resample'命令输出相同大小的网格。但是,结果看起来像最近邻插值而不是双线性插值。

我是否遗漏了一些方法,使用光栅包进行双线性插值?或者是否有更好的方法来完成双线性插值以填充NA?

library(raster)

# raster containing gap
r <- raster(nrow=10, ncol=10)
r[] <- 1:ncell(r)
r[25] <- NA

# The s raster is the same size as the r raster
s <- raster(nrow=10, ncol=10)
s <- resample(r, s, method='bilinear')
plot(r)
plot(s)
s[25]
s[35]
# s[25] appears to have been filled with neighbor s[35]

更新

Akima软件包似乎是上述光栅方法的一种有前途的替代方案,但如果在输入网格值(Z矩阵)中存在NA,我会遇到麻烦。这是一个与上面示例平行的示例以进行演示。 (同样,我将内插到与原始尺寸相同的网格中。)

library(akima)

# Use bilinear interpolation (no NAs in input)
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # works
plot(raster(rmat), main = "original")
plot(raster(smat$z), main = "interpolated")

# Try using bilinear interpolation but with an NA
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
rmat[3,5] <- NA
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # Error about NAs

UPDATE2

@Robert Hijmans提出了一个很好的问题,即为什么不在光栅包中使用一个移动窗口平均值和focal()命令。原因是我想尝试双线性插值,我不认为移动窗口平均值总是给出与双线性插值相同的答案。但是,在我发布的示例中并不清楚这一点(在该示例中,移动窗口和双线性interp 给出相同的答案),因此我将在下面的新示例中进行演示。请注意,对于以下示例(here is a handy calculator for tests),双线性插值解决方案应为8。

library(raster)
r <- raster(nrow=10, ncol=10)

# Different grid values than earlier examples
values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA
plot(r)

# See what the mean of the moving window produces
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE) 
f[25] # Moving window gives 5 but bilinear interp gives 8

# Note that this seems to be how the moving window works with equal weights
window_test <- c(r[14:16], r[24:26], r[34:36])
 mean(window_test, na.rm = T)

我在这里遗漏了什么吗?也许有一些聪明的,使用focal()的权重参数可以产生双线性插值解?

1 个答案:

答案 0 :(得分:3)

让我们使用等距离单元来避免因lon / lat数据的单元大小变化而产生的差异

library(raster)
r <- raster(nrow=10, ncol=10, crs='+proj=utm +zone=1 +datum=WGS84', xmn=0, xmx=1, ymn=0, ymx=1)

对于此示例,您可以使用focal

values(r) <- 1:ncell(r)
r[25] <- NA
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE) 

我看到你忽视了“基于邻域的解决方案而不是双线性插入”。但问题是为什么。在这种情况下,您可能需要基于邻域的解决方案。

更新。然后,在细胞不是近似正方形的情况下,双线性将是优选的。

values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA

双线性插值的问题通常使用4个连续的单元格,但在这种情况下,您需要单元格中心的值,适当的单元格将是单元格本身的值,因为到该单元格的距离是零,因此这是插值结束的地方。例如,对于单元格23

extract(r, xyFromCell(r, 23))
#6
extract(r, xyFromCell(r, 23), method='bilinear')
#[1] 6

在这种情况下,焦点细胞是NA,因此您可以获得焦点细胞的平均值和另外3个细胞。问题是哪三个?它是任意的,但要使其工作,NA单元必须得到一个值。 raster算法将NA单元格下方的值分配给该单元格(此处也为8)。我认为,这在边缘(例如陆地/海洋)处理NA值时效果很好,但在这种情况下可能不是这样。 `     extract(r,xyFromCell(r,25))     #NA     extract(r,xyFromCell(r,25),method ='bilinear')     #[1] 8

这也是resample给出的

resample(r, r)[25]
# 8

这也是在线计算器的建议吗?

这对小变化非常敏感

extract(r, xyFromCell(r, 25)+0.0001, method='bilinear')
#[1] 4.998997

在这种情况下我真正想要的是车友的意思

mean(r[adjacent(r, 25, pairs=FALSE)])
[1] 6

或者,更一般地说,局部反距离加权平均值。你可以计算 通过设置焦点

的权重矩阵
# compute weights matrix
a <- sort(adjacent(r, 25, 8, pairs=F, include=TRUE))
axy <- xyFromCell(r, a)
d <- pointDistance(axy, xyFromCell(r, 25), lonlat=F)
w <- matrix(d, 3, 3)
w[2,2] <- 0
w <- w / sum(w)

# A simpler approach could be: 
# w <- matrix(c(0,.25,0,.25,0,.25,0,.25,0), 3, 3)


foc <- focal(r, w, na.rm=TRUE, NAonly=TRUE)
foc[25]

在这个例子中,这很好;但如果焦点区域有多个NA值(因为权重之和不再是1),那就不正确了。我们可以通过计算权重之和来纠正它

x <- as.integer(r/r)
sum_weights <- focal(x, w, na.rm=TRUE, NAonly=TRUE)

fw <- foc/sum_weights
done <- cover(r, fw)
done[25]