以函数名作为参数的并行处理

时间:2015-03-20 04:09:35

标签: r parallel-foreach doparallel

当为非并行版本传递函数名称或者在并行版本中对函数名称进行硬编码时,下面的代码可以正常工作。我需要进行哪些更改才能传入并行版本的函数名称(使用bpar设置为TRUE调用)?

require(doParallel)

MyFunc <- function(fname, bpar) {
    fname1 <- function(n) { data.frame(a=rep(3,n), b=rep(4,n)) }
    fname2 <- function(n) { data.frame(a=rep(1,n), b=rep(2,n)) }

    nobs <- 100
    if(bpar) {
        incr <- ceiling(nobs/getDoParWorkers())
        out.dt <- foreach(ind=seq(1,nobs,incr), .combine=rbind, .multicombine=TRUE) %dopar% {
            do.call('rbind', lapply(seq(ind,min(ind+incr-1,nobs)), fname ))
        }
    } else {
        out.dt <- do.call('rbind', lapply(1:nobs, fname))
    }
}

df1 <- MyFunc("fname1", FALSE)  #works
df2 <- MyFunc("fname2", FALSE)  #works

cl <- makeCluster(3)
registerDoParallel(cl)
df3 <- MyFunc("fname1", TRUE)   #fails
df4 <- MyFunc("fname2", TRUE)   #fails
stopCluster(cl)

我得到的错误是:

Error in { : 
  task 1 failed - "object 'fname1' of mode 'function' was not found"
Error in { : 
  task 1 failed - "object 'fname2' of mode 'function' was not found"

0 个答案:

没有答案