nlsBoot和foreach%dopar%:范围问题

时间:2012-11-14 17:22:07

标签: r foreach scope nls statistics-bootstrap

我想在循环中为nls拟合残差的引导。我使用nlsBoot并且为了减少计算时间,我想并行执行(目前在Windows 7系统上)。这是一些代码,它可以重现我的问题:

#function for fitting
Falge2000 <- function(GP2000,alpha,PAR) {
  (GP2000*alpha*PAR)/(GP2000+alpha*PAR-GP2000/2000*PAR)
}

#some data
PAR <- 10:1600
GPP <- Falge2000(-450,-0.73,PAR) + rnorm(length(PAR),sd=0.0001)
df1 <- data.frame(PAR,GPP)

#nls fit
mod <- nls(GPP~Falge2000(GP2000,alpha,PAR),start=list(GP2000=-450,alpha=-0.73),data=df1, upper=c(0,0),algorithm="port")

#bootstrap of residuals
library(nlstools)
summary(nlsBoot(mod,niter=5))
#works

#now do it several times
#and in parallel
library(foreach)
library(doParallel)

cl <- makeCluster(1)
registerDoParallel(cl)

ttt <- foreach(1:5, .packages='nlstools',.export="df1") %dopar% {
  res <- nlsBoot(mod,niter=5)
  summary(res)

}
#Error in { : 
#task 1 failed - "Procedure aborted: the fit only converged in 1 % during bootstrapping"

stopCluster(cl)

我怀疑这是环境问题,在查看nlsBoot的代码后,问题似乎是在lapply调用中使用匿名函数引起的:

l1 <- lapply(1:niter, function(i) {
    data2[, var1] <- fitted1 + sample(scale(resid1, scale = FALSE), 
        replace = TRUE)
    nls2 <- try(update(nls, start = as.list(coef(nls)), data = data2), 
        silent = TRUE)
    if (inherits(nls2, "nls")) 
        return(list(coef = coef(nls2), rse = summary(nls2)$sigma))
})
if (sum(sapply(l1, is.null)) > niter/2) 
    stop(paste("Procedure aborted: the fit only converged in", 
        round(sum(sapply(l1, is.null))/niter), "% during bootstrapping"))

有没有办法在并行循环中使用nlsBoot?或者我需要修改功能吗? (我可以尝试使用for循环代替lapply。)

1 个答案:

答案 0 :(得分:1)

通过将mod对象的创建移动到%dopar%循环,看起来一切正常。此外,这会自动导出df1对象,因此您可以删除.export参数。

ttt <- foreach(1:5, .packages='nlstools') %dopar% {
  mod <- nls(GPP~Falge2000(GP2000,alpha,PAR),start=list(GP2000=-450,alpha=-0.73),data=df1, upper=c(0,0),algorithm="port")
  res <- nlsBoot(mod,niter=5)
  capture.output(summary(res))

}

但是,您可能需要弄清楚要返回的内容。使用capture.output只是为了查看事情是否有效,因为summary(res)似乎只返回NULL