我必须对练习进行随机森林分类,并且该练习专门针对参数进行说明,并引用我的语言
箱包百分比:25%50%85%
一个节点的尺寸数:10%,50%,80%
我将scikit-learn用于分类器,但我不知道该类中的哪些参数用于设置袋中百分比和尺寸数。
答案 0 :(得分:1)
您可以使用max_features
参数定义尺寸数。像这样:
rf = RandomForestClassifier(max_features=.1)
很遗憾,RandomForestClassifier
目前还不支持子采样(即袋中百分比)。但是,此功能已在sklearn的当前开发分支中added,因此将来会可用。
目前一个不错的解决方法是使用BaggingClassifier
:它有一个max_samples
参数用于二次采样,并且可以使用RandomForestClassifier
作为基础将其转换为DecisionTreeClassifier
。
base = DecisionTreeClassifier(max_features=.1)
rf = BaggingClassifier(base_estimator=base, max_samples=.25)
请注意,BaggingClassifier
也有一个max_features
参数,但其作用与随机森林不同。