R中的分布式计算

时间:2013-09-12 04:09:51

标签: r distributed-computing distributed-r

我制定了一个估算器,我想通过用R进行模拟研究来检查其性能。我想重复实验500次。不幸的是,估计器中涉及的计算是复杂的。每次复制在我的桌面上需要15分钟。我正在寻找一些用R的分布式计算方法。我应该如何开始?我用Google搜索了这个话题。有很多关于此的帖子。

2 个答案:

答案 0 :(得分:2)

我建议从foreach包开始。如果您使用的是maclinux,则以下是进行并行计算的最简单方法:

# First we register a parallel backend. This will work on mac and linux.
# Windows is more complicated, try the `snow` package.
library(doMC)
registerDoMC(cores=4) # substitute for number of cores you want to run on.

# now we can run things in parallel using foreach
foreach (i = 1:4) %dopar% {
  # What's in here will run on a separate core for each iteration.
}

您应该阅读foreach的插图,因为它与for(特别是嵌套循环)完全不同,并且它在结束时结合并返回结果时也非常强大。

答案 1 :(得分:2)

任何R问题的第一步应该是检查CRAN任务视图。哦,看:

http://cran.r-project.org/web/views/HighPerformanceComputing.html

请注意,StackOverflow并不是真正的问题,可以通过“阅读那里的文档”或“为什么不尝试使用工具X?”来提出最佳答案的广泛问题。