使用MLR训练了分类randomForestSRC(https://www.rdocumentation.org/packages/randomForestSRC/versions/2.6.0)后,模型大小为多GB,每个实例的预测时间非常慢。
我们可以从模型中删除什么来减小尺寸,并且可能会缩短预测时间?
注意一些测试表明,预测100项与预测1的速度基本相同。
**Prediction: 1 observations**
predict.type: prob
threshold: 0=0.50,1=0.50
**time: 70.25**
**Prediction: 100 observations**
predict.type: prob
threshold: 0=0.50,1=0.50
**time: 69.82**
答案 0 :(得分:3)
您可以调整一些参数来减小模型的大小。特别是:
ntree
以减少树木nodesize
nodedepth
以获得更浅的树答案 1 :(得分:3)
如果您不受分类林的此特定实现的约束,您可能需要尝试使用游侠(“classif.ranger”)。
您可以在此处找到这些实施的比较: https://www.jstatsoft.org/article/view/v077i01