我在matlab 2011b中使用'bag'的fitensemble函数进行分类,使用以下内容:
fitensemble(feature,classLabels,'Bag',10,'tree','type','classification');
有人可以告知fitensemble如何选择功能来构建每个决策树吗?它是否为每棵树选择了所有特征的子集(就像原始的Breiman的随机森林一样)?或者它选择构建每棵树的所有功能?
例如,如果数据集中有500个要素,那么每棵树是基于500个要素构建的,还是随机选择500个要素的子集来构建每个树?
答案 0 :(得分:1)
查看NVarToSample
和ClassificationTree.template
的{{1}}属性。您可以将其设置为正整数或“全部”。默认情况下,对于分类Regressiontree.template
,使用'all'进行提升,并使用变量数量的平方根进行装袋(您的情况)。对于回归,它使用'all'来提升和1/3用于装袋的变量数。