R - MLR - randomForestSRC - 模型大小巨大,预测时间非常慢 - 如何减少两者?

时间:2018-05-03 09:56:03

标签: r random-forest mlr

使用MLR训练了分类randomForestSRC(https://www.rdocumentation.org/packages/randomForestSRC/versions/2.6.0)后,模型大小为多GB,每个实例的预测时间非常慢。

我们可以从模型中删除什么来减小尺寸,并且可能会缩短预测时间?

注意一些测试表明,预测100项与预测1的速度基本相同。

**Prediction: 1 observations**
predict.type: prob
threshold: 0=0.50,1=0.50
**time: 70.25**

**Prediction: 100 observations**
predict.type: prob
threshold: 0=0.50,1=0.50
**time: 69.82**

https://kogalur.github.io/randomForestSRC/theory.html

2 个答案:

答案 0 :(得分:3)

您可以调整一些参数来减小模型的大小。特别是:

  • 减少ntree以减少树木
  • 针对每个叶子的大量数据点增加nodesize
  • 减少nodedepth以获得更浅的树

答案 1 :(得分:3)

如果您不受分类林的此特定实现的约束,您可能需要尝试使用游侠(“classif.ranger”)。

您可以在此处找到这些实施的比较: https://www.jstatsoft.org/article/view/v077i01