RandomForest算法选择了多少个功能?

时间:2014-12-12 17:07:45

标签: machine-learning random-forest feature-extraction

我正在使用随机林,我想知道功能选择是如何工作的。 我有一组423个功能,我知道它们是使用log2(F)+ 1随机选择的。所以这样我得到了12/13特征子集。但我无法理解的是选择是多么随机,如果每个树的子集应该是不同的,或者所有树的子集是相同的,但多个组合的不同之处。 如果我有一个有10棵树的模型,那么特征选择是否应该因树而异?谢谢你的帮助。

1 个答案:

答案 0 :(得分:0)

森林中的每棵树都会获得不同的随机样本。决策树学习通常是确定性的,因此如果每棵树具有相同的特征集,它们都将学习相同的决策树,这会破坏目的。您希望所有人都能够在不同的功能子集上接受培训。

如果算法从原始的423个特征集中选择12个特征的子集,则每个树将从整个集合中获得其自己的12个特征样本(无需替换)。