如何确保随机森林中的所有树中都包含一个功能

时间:2018-05-28 09:33:26

标签: random-forest sklearn-pandas

目前我使用sklearn构建随机森林分类器,但我想确保一个特定的功能,我认为是最重要的功能,将包含在所有生成的决策树中。

最简单的方法是什么?我应该自己实现自定义随机森林算法还是只更改sklearn软件包的源代码?如果是这样,我该如何改变它?谢谢!

1 个答案:

答案 0 :(得分:0)

初始化RandomForestClassifier对象,并将warm_start属性设置为true。适合RF,迭代其成员树(如estimators_属性中所列),并删除所有不包含这个可能非常重要的功能。重复此过程,直到您拥有准备好所需数量的特征活动成员树的RF模型。