我正在编写一个函数,我希望为用户提供并行运行的选项。出于各种原因,我更喜欢foreach
给竞争对手。到目前为止,我已经将其设置为类似于下面的虚拟函数:
library(foreach)
myfun <- function(parallel = TRUE){
if (parallel == TRUE){
require(doMC)
registerDoMC(detectCores())
foreach(i = 1:10) %dopar% {
print(i)
}
} else {
foreach(i = 1:10) %do% {
print(i)
}
}
return('OK!')
}
myfun()
这比它看起来需要的时间更长,并且冒着我可能不记得反映对底部顶部所做的任何更改的风险。我更喜欢做以下(非工作)之类的事情,但我不知道是否可以这样做:
myfun <- function(parallel = TRUE){
if (parallel == TRUE){
require(doMC)
registerDoMC(detectCores())
}
foreach(i = 1:10) ifelse(parallel == TRUE, %dopar%, %do%) {
print(i)
}
return('OK!')
}
任何选择%do%
vs %dopar%
的方法都取决于函数的arg?我想我可以只注册1个核心并且每次都会调用%dopar%
,但是这会发出关于没有注册并行后端的警告,这可能会让那些不是我的人感到困惑。
答案 0 :(得分:5)
以下代码似乎有效。
(我使用doParallel
代替doMC
,因为我使用的是Windows机器。)
这里的技巧是定义一个函数%fun%
,它取值%do%
或%dopar
。这是有效的,因为R中的函数是第一类对象,您可以使用现有函数的值分配新函数。唯一的小细节是你必须在反引号中使用%do%
。
library(foreach)
require(doParallel)
foo <- function(parallel = TRUE){
`%fun%` <- `%do%`
if (parallel == TRUE){
require(doParallel)
cl <- makePSOCKcluster(detectCores())
registerDoParallel(cl)
`%fun%` <- `%dopar%`
}
foreach(i = 1:10) %fun% {
print(i)
}
return('OK!')
}
foo(FALSE)
foo(TRUE)