目前我使用sklearn构建随机森林分类器,但我想确保一个特定的功能,我认为是最重要的功能,将包含在所有生成的决策树中。
最简单的方法是什么?我应该自己实现自定义随机森林算法还是只更改sklearn软件包的源代码?如果是这样,我该如何改变它?谢谢!
答案 0 :(得分:0)
初始化RandomForestClassifier
对象,并将warm_start
属性设置为true。适合RF,迭代其成员树(如estimators_
属性中所列),并删除所有不包含这个可能非常重要的功能。重复此过程,直到您拥有准备好所需数量的特征活动成员树的RF模型。