我的问题与此question有关。但是,上面提到的问题使用的multicore
包已被parallel
取代。无法在parallel
包中复制响应中的大多数功能。有没有办法跟踪mclapply
的进度。在查看mclapply
文档时,有一个名为mc.silent
的参数,我不确定这是否能够跟踪进度,如果是,我们可以在何处以及在何处查看日志文件?我在ubuntu
linux操作系统上运行。请参阅下面的一个可重现的示例,我想对其进行处理。
require(parallel)
wait.then.square <- function(xx){
# Wait for one second
Sys.sleep(2);
# Square the argument
xx^2 }
output <- mclapply( 1:10, wait.then.square, mc.cores=4,mc.silent=FALSE)
非常感谢任何帮助。
答案 0 :(得分:5)
感谢包pbmcapply
,您现在可以轻松跟踪mclapply
和mcmapply
个工作的进度。只需将mclapply
替换为pbmclapply
:
wait.then.square <- function(xx) {
Sys.sleep(2)
xx^2
}
library(pbmcapply)
output <- pbmclapply(1:10, wait.then.square, mc.cores = 4)
...这将显示一个漂亮的进度条。
作者在技术细节和性能基准here上有一篇很好的博客文章。
答案 1 :(得分:3)
这是我related answer的更新。
library(parallel)
finalResult <- local({
f <- fifo(tempfile(), open="w+b", blocking=T)
if (inherits(parallel:::mcfork(), "masterProcess")) {
# Child
progress <- 0.0
while (progress < 1 && !isIncomplete(f)) {
msg <- readBin(f, "double")
progress <- progress + as.numeric(msg)
cat(sprintf("Progress: %.2f%%\n", progress * 100))
}
parallel:::mcexit()
}
numJobs <- 100
result <- mclapply(1:numJobs, function(...) {
# Do something fancy here... For this example, just sleep
Sys.sleep(0.05)
# Send progress update
writeBin(1/numJobs, f)
# Some arbitrary result
sample(1000, 1)
})
close(f)
result
})
cat("Done\n")