随机森林分类,测试培训数据

时间:2018-09-23 00:19:56

标签: machine-learning random-forest

我是机器学习环境的新手。我注意到随机森林分类器由决策树组成,决策树依靠统计数据对样本进行分类。随机森林是否有可能错误地将训练集中的样本分类?

1 个答案:

答案 0 :(得分:0)

是的。 如果决策树的深度不足以捕获数据的本质。 例如,让我们考虑具有两个特征X1X2的数据。

target = 1 if X1 >5 and X2 > 10, else target = 0

深度为1时,决策树将仅依赖其中一项功能。

例如,示例如果决策树使用X1功能来构造拆分, 样本(7, 15)(7, 7)都将被分类为1,这对(7,7)是错误的,因为X2 = 7 < 10