R等价于python的os.getpid()用于并行处理

时间:2015-09-30 23:43:24

标签: python r parallel-processing multiprocessing

我经常在python(多处理库)和r(雪等包)下使用并行处理。 我发现在python中非常有用的一件事是能够使用实例的唯一标识符记录各个实例的进度,因此我可以跟踪,例如,是否启动了正确数量的实例并正确运行。 要在python中执行此操作,我只需使用os.getpid()。

r中是否有类似的命令?我搜索过但没找到。

例如,下面是r中抽象并行代码的示例,我希望实例日志文件包含日志文件名中的实例ID(第17行),以及进程启动的时间:

rm(list = ls()) #remove all past worksheet variables
wd="D:/temp/" #location for log files
setwd(wd)
n_spp=30
spp_nmS=paste0("sp_",c(1:n_spp))
#sp_nm=spp_nmS[1]
library(snowfall)

#stop sinks
sink.reset <- function(){
  for(i in seq_len(sink.number())){
    sink(NULL)
  }
}

sp_parallel_run=function(sp_nm){
  file_nm=paste0(wd,sp_nm,"_log_",format(Sys.time(), "%a %b %d %H%M%S"), ".txt")
  con=file(file_nm, open="wt")
  sink(con)
  cat('\n', 'Started on ', date(), '\n') 
  ptm0 <- proc.time()

  #start code
  sp_nm
  Sys.sleep(10)

  #end code
  ptm1=proc.time() - ptm0
  jnk=as.numeric(ptm1[3])
  cat('\n','It took ', jnk, "seconds to model", sp_nm)

  sink.reset()
  close(con)
}

sfInit( parallel=TRUE, cpus=as.integer(Sys.getenv('NUMBER_OF_PROCESSORS'))) # 
sfExportAll()
sfLapply(x=spp_nmS, fun=sp_parallel_run)

sfRemoveAll()
sfStop()

1 个答案:

答案 0 :(得分:4)

??pid返回结果列表顶部附近的base::Sys.getpid(取决于您安装的软件包)。

有关详细信息,请参阅?Sys.getpid