使用大型栅格查找表格(在R中)

时间:2016-03-14 14:48:15

标签: r function spatial r-raster bigdata

真的希望你能帮助我。感谢您提前了解我从这些页面中学到的所有内容。道歉,我的专业知识受限于兼职性质,我试图在R中学习所有内容。

我的目标: 使用(大)栅格查找表反转。

我现在所拥有的:

#Observed data (in this case just as a dataframe)
obs <- data.frame(runif(100,0,1))

#Two sets of simulated data (often n >10 000)
sim.A <- data.frame(runif(1000,0,1))

sim.B <- data.frame(runif(1000,0,1))

#Calculate the error [cost] for each observed value and every simulated(A) value
error.fun <- function(x){sqrt((x-sim.A)^2)}              
error <- apply(obs,1,error.fun) 

#Find the position of the min [error] value
min.func <- function(x){which(x == min(x),arr.ind = F)}    
cost.min <- apply(error,2,min.func)

#Subset the simulated (B) dataset at the position of the least error[cost.min]
LUT.values = data.frame(sim.B[cost.min,])

我的问题:

1)上面的代码适用于从栅格中提取的样本。但是,我需要用整个(ncell&gt; 1Mil)栅格替换采样观测值。我显然需要优化上述两个函数(合并为一个?),但最接近我的情况让我持怀疑态度,因为与采样数据尝试相比,结果很差。

我尝试使用大型栅格:

#This runs, but I dont think it's working correctly

crs.UTM <- CRS("+proj=utm +zone=36 +south +datum=WGS84 +units=m +no_defs+ellps=WGS84 +towgs84=0,0,0")
r <- raster( crs=crs.UTM)
extent(r) <- extent(0, 100, 0, 100) 
res(r) <- c(1, 1)
values(r) <- runif(ncell(r), 0, 1)

#Simulated data (often n >10 000)
sim.A <- data.frame(runif(1000,0,1))

sim.B <- data.frame(runif(1000,0,1))

cost.min.func <- function(x){
cost <- sqrt((x-sim.A)^2)     
c.min <- sim.B[which(cost == min(cost),arr.ind = FALSE),]}

LUT.rst <- calc(r,cost.min.func)

非常感谢

2 个答案:

答案 0 :(得分:1)

我认为这就是你的目标

library(raster)
r <- raster(ext=extent(0, 100, 0, 100), res=1, crs="+proj=utm +zone=36 +south +datum=WGS84 +units=m")

set.seed(0)
values(r) <- runif(ncell(r), 0, 1)

sim.A <- runif(1000,0,1)
sim.B <- runif(1000,0,1)

cost <- function(x) {
  y <- abs(x-sim.A)
  sim.B[which.min(y)]
}
x <- calc(r, cost)

大型数据集需要一段时间。应该可以通过使用x的一系列值来首先对此进行近似,然后可能只考虑为可能具有最小值的几个单元计算此值

答案 1 :(得分:0)

您缺少的是observed - simulated的平均值:

rmse <- sqrt(mean((obs-sim)^2))