我知道随机森林分类器在决策树上使用聚合来确定最终分类。
我在这里阅读:https://www.datascience.com/blog/classification-random-forests-in-python
“随机森林是一种集成决策树算法,因为在回归问题的情况下,最终预测是每个决策树的平均预测;在分类中,它是最频繁预测的平均” / p>
我有兴趣找出我的RFC的最终决策路径是什么,即它取平均值的是哪棵树(这似乎是具有“最频繁预测”的树)
我只是不确定我是否理解最频繁的预测是什么意思,比如说我有3个类别(1、2、3),而RFC则最频繁地预测3类,这是否意味着元RFC将采用预测等级3的所有树木的平均值?从直觉上看这是错误的。
有人可以帮我解释一下吗?