当树的数量增加超过一定数量时执行randomForest时出错

时间:2018-01-04 09:10:30

标签: r random-forest

我正在运行radomForest模型。该模型运行良好,直到722棵树。但如果我将树的数量增加到722以上,我就会收到以下错误:

Error message

由于模型在722树之前运行良好,我想知道它是否可能是内存问题。您认为有任何方法可以验证这一点或找出错误是什么吗?

请在下面找到数据集的详细信息: •文件大小:63MB •#obs:742,599 •列数:17(响应变量的所有数字期望值)

1 个答案:

答案 0 :(得分:1)

您正在使用randomForest包?,另一种选择是使用 spark.randomForest {SparkR}h2o.randomForest,这些软件包在大数据中提供了更强的执行能力,在以下link中他们将随机森林的算法与1000万的观察结果进行了比较,最佳选项是h2o和xgboost。