森林随机袋内和节点尺寸

时间:2019-10-10 14:55:06

标签: python machine-learning scikit-learn data-science random-forest

我必须对练习进行随机森林分类,并且该练习专门针对参数进行说明,并引用我的语言

  

箱包百分比:25%50%85%

     

一个节点的尺寸数:10%,50%,80%

我将scikit-learn用于分类器,但我不知道该类中的哪些参数用于设置袋中百分比和尺寸数。

1 个答案:

答案 0 :(得分:1)

您可以使用max_features参数定义尺寸数。像这样:

rf = RandomForestClassifier(max_features=.1)

很遗憾,RandomForestClassifier目前还不支持子采样(即袋中百分比)。但是,此功能已在sklearn的当前开发分支中added,因此将来会可用。

目前一个不错的解决方法是使用BaggingClassifier:它有一个max_samples参数用于二次采样,并且可以使用RandomForestClassifier作为基础将其转换为DecisionTreeClassifier

base = DecisionTreeClassifier(max_features=.1)    
rf = BaggingClassifier(base_estimator=base, max_samples=.25)

请注意,BaggingClassifier也有一个max_features参数,但其作用与随机森林不同。