我试图在foreach()并行化下使用并行计算和ranger()函数来拟合随机森林分类模型。如果我使用7个核心进行处理,我会得到一个结果列表,我可以从中提取7个单独的游侠,但是我无法将结果组合起来以创建预测模型。
rf<-foreach(num.tree=rep(80,7), .multicombine=TRUE, .verbose=TRUE,
.packages=c('ranger', 'randomForest', 'methods')) %dopar% {
ranger(hotel_cluster~. , as.data.frame(train_s01[(1:10000),]), num.tree=num.tree, write.forest=TRUE)
}
我尝试过使用.combine = combine函数,但是它会抛出错误,我不确定从那里开始。关于如何结合这些的任何建议都会很棒。
作为旁注,我的完整数据集非常大(3700万行)并且有100个类,因此由于因素限制我将无法使用randomForest包,并且我不希望将这些类聚类为任何进一步。
干杯