我是机器学习环境的新手。我注意到随机森林分类器由决策树组成,决策树依靠统计数据对样本进行分类。随机森林是否有可能错误地将训练集中的样本分类?
答案 0 :(得分:0)
是的。
如果决策树的深度不足以捕获数据的本质。
例如,让我们考虑具有两个特征X1
和X2
的数据。
target = 1 if X1 >5 and X2 > 10, else target = 0
深度为1时,决策树将仅依赖其中一项功能。
例如,示例如果决策树使用X1
功能来构造拆分,
样本(7, 15)
和(7, 7)
都将被分类为1,这对(7,7)
是错误的,因为X2 = 7 < 10
。