根据函数的参数调用%do%vs%dopar%(foreach)

时间:2016-04-06 16:04:40

标签: r foreach

我正在编写一个函数,我希望为用户提供并行运行的选项。出于各种原因,我更喜欢foreach给竞争对手。到目前为止,我已经将其设置为类似于下面的虚拟函数:

library(foreach)
myfun <- function(parallel = TRUE){
  if (parallel == TRUE){
    require(doMC)
    registerDoMC(detectCores())
    foreach(i = 1:10) %dopar% {
      print(i)
    }
  } else {
    foreach(i = 1:10) %do% {
      print(i)
    }
  }
  return('OK!')
}
myfun()

这比它看起来需要的时间更长,并且冒着我可能不记得反映对底部顶部所做的任何更改的风险。我更喜欢做以下(非工作)之类的事情,但我不知道是否可以这样做:

myfun <- function(parallel = TRUE){
  if (parallel == TRUE){
    require(doMC)
    registerDoMC(detectCores())
  }
  foreach(i = 1:10) ifelse(parallel == TRUE, %dopar%, %do%) {
    print(i)
  }
  return('OK!')
}

任何选择%do% vs %dopar%的方法都取决于函数的arg?我想我可以只注册1个核心并且每次都会调用%dopar%,但是这会发出关于没有注册并行后端的警告,这可能会让那些不是我的人感到困惑。

1 个答案:

答案 0 :(得分:5)

以下代码似乎有效。

(我使用doParallel代替doMC,因为我使用的是Windows机器。)

这里的技巧是定义一个函数%fun%,它取值%do%%dopar。这是有效的,因为R中的函数是第一类对象,您可以使用现有函数的值分配新函数。唯一的小细节是你必须在反引号中使用%do%

library(foreach)
require(doParallel)

foo <- function(parallel = TRUE){
  `%fun%` <- `%do%`
  if (parallel == TRUE){
    require(doParallel)
    cl <- makePSOCKcluster(detectCores())
    registerDoParallel(cl)
    `%fun%` <- `%dopar%`
  }
  foreach(i = 1:10) %fun% {
    print(i)
  }
  return('OK!')
}

foo(FALSE)
foo(TRUE)