我一直在努力进行这种分析并posted on the stats site关于我是否正在朝着正确的方向发展,但正如我一直在调查的那样,我也发现了我可爱的强劲处理器(linux OS,i7)实际上只使用其中一个核心。事实证明这是默认行为,但我有一个相当大的数据集,可以选择40到50个变量。
检查各种不同模型的stepAIC函数看起来像是一个理想的parellizing,但我是R的相对新手,我只有关于并行计算的粗略概念。
我已经看过并行包和降雪的文档,但是这些似乎有一些用于并行化的内置列表函数,我不知道如何将stepAIC转换为可以的形式使用这些包在parellel中运行。
有没有人知道1)这是否是一项可行的练习,2)如何做我想做的事情,可以给我一些我需要的基本结构/关键词列表?
提前致谢, 斯蒂芬
答案 0 :(得分:3)
我认为一个步骤依赖于de last的过程(如逐步选择)并不是平行的。
我知道最简单的并行方法是:
library(doMC)
registerDoMC()
l <- foreach(i=1:X) %dopar% { fun(...) }
由于我对逐步的理解很差,因此提取模型的变量(或添加前向/后向)并测量每个步骤中的拟合。例如,如果提取变量,模型拟合最好保留此模型。在foreach并行函数中,每一步都对其他步骤视而不见,也许您可以编写自己的函数来执行此任务,如
http://beckmw.wordpress.com/tag/stepwise-selection/
我查找了这段代码,在我看来你可以使用vif_func函数进行并行计算......
我认为您还应检查优化代码以执行该任务,如包跳过
http://cran.r-project.org/web/packages/leaps/index.html
希望这会有所帮助...