并行化:打包“并行”而不是“mclapply”

时间:2015-01-12 16:42:22

标签: r parallel-processing mclapply

我正在尝试将此代码转换为可在Windows上执行的代码:

numCores <- detectCores()
results <- mclapply(seq(1, 500), function(file, fID){
  myData <- fread(file.path(dirPath, fID, paste0(file, ".csv")))
  return(cbind(myData, rep(file, nrow(myData))))
}, mc.cores = numCores, fID = 1)

基于使用this tutorial,我编写了以下代码......

更新:下面提供了正确的代码:

getAllMyData <- function(numCores,folderID)
{
  dirPath = paste0("D:/home/", folderID, '/')
  cl <- makeCluster( 4 )
  allTrips = parLapply(cl, 1:200, function(z){
    myData <- read.csv(paste0(dirPath, z, ".csv"))
    return(cbind(myData , rep(z, nrow(myData))))
  })
  stopCluster(cl)  
  return(allTrips)
}

numCores <- detectCores()
allMyData <- getAllMyData(numCores,1)

1 个答案:

答案 0 :(得分:1)

您的第一个代码调用函数

function(file, fID)

相反,您的第二个代码使用

function(dirPath,fID)

那是错误。