真的希望你能帮助我。感谢您提前了解我从这些页面中学到的所有内容。道歉,我的专业知识受限于兼职性质,我试图在R中学习所有内容。
我的目标: 使用(大)栅格查找表反转。
我现在所拥有的:
#Observed data (in this case just as a dataframe)
obs <- data.frame(runif(100,0,1))
#Two sets of simulated data (often n >10 000)
sim.A <- data.frame(runif(1000,0,1))
sim.B <- data.frame(runif(1000,0,1))
#Calculate the error [cost] for each observed value and every simulated(A) value
error.fun <- function(x){sqrt((x-sim.A)^2)}
error <- apply(obs,1,error.fun)
#Find the position of the min [error] value
min.func <- function(x){which(x == min(x),arr.ind = F)}
cost.min <- apply(error,2,min.func)
#Subset the simulated (B) dataset at the position of the least error[cost.min]
LUT.values = data.frame(sim.B[cost.min,])
我的问题:
1)上面的代码适用于从栅格中提取的样本。但是,我需要用整个(ncell&gt; 1Mil)栅格替换采样观测值。我显然需要优化上述两个函数(合并为一个?),但最接近我的情况让我持怀疑态度,因为与采样数据尝试相比,结果很差。
我尝试使用大型栅格:
#This runs, but I dont think it's working correctly
crs.UTM <- CRS("+proj=utm +zone=36 +south +datum=WGS84 +units=m +no_defs+ellps=WGS84 +towgs84=0,0,0")
r <- raster( crs=crs.UTM)
extent(r) <- extent(0, 100, 0, 100)
res(r) <- c(1, 1)
values(r) <- runif(ncell(r), 0, 1)
#Simulated data (often n >10 000)
sim.A <- data.frame(runif(1000,0,1))
sim.B <- data.frame(runif(1000,0,1))
cost.min.func <- function(x){
cost <- sqrt((x-sim.A)^2)
c.min <- sim.B[which(cost == min(cost),arr.ind = FALSE),]}
LUT.rst <- calc(r,cost.min.func)
非常感谢
答案 0 :(得分:1)
我认为这就是你的目标
library(raster)
r <- raster(ext=extent(0, 100, 0, 100), res=1, crs="+proj=utm +zone=36 +south +datum=WGS84 +units=m")
set.seed(0)
values(r) <- runif(ncell(r), 0, 1)
sim.A <- runif(1000,0,1)
sim.B <- runif(1000,0,1)
cost <- function(x) {
y <- abs(x-sim.A)
sim.B[which.min(y)]
}
x <- calc(r, cost)
大型数据集需要一段时间。应该可以通过使用x的一系列值来首先对此进行近似,然后可能只考虑为可能具有最小值的几个单元计算此值
答案 1 :(得分:0)
您缺少的是observed - simulated
的平均值:
rmse <- sqrt(mean((obs-sim)^2))