强制拆分随机森林

时间:2016-05-05 06:47:13

标签: python scikit-learn

使用随机森林的scikit。是否可以强制拆分某个二进制功能。我有一个数据集,其中一个功能是男人或女人。我发现它们差别很大,以至于第一次分裂应该是关于性的。我当然可以制作模型,但它对一个模型来说很实用。

1 个答案:

答案 0 :(得分:0)

简而言之,没有。

但是,您的问题表明您并不完全了解随机森林的运作方式。

我建议阅读https://citizennet.com/blog/2012/11/10/random-forests-ensembles-and-performance-metrics/

数据中的分割以最大化分割之间的方差的方式完成。因此,如果您提到的功能具有真实的预测性,那么树木应该在某个点上分割该功能(取决于其他功能的预测能力)。

此外,sklearn中的所有树模型都具有导出拆分的功能 - 因此您可以适合树并检查发生了什么。

http://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html

统计学习要素中的第9章(可在作者网站上免费下载)如果你想了解更多,可以更深入地介绍理论。