使用随机森林的scikit。是否可以强制拆分某个二进制功能。我有一个数据集,其中一个功能是男人或女人。我发现它们差别很大,以至于第一次分裂应该是关于性的。我当然可以制作模型,但它对一个模型来说很实用。
答案 0 :(得分:0)
简而言之,没有。
但是,您的问题表明您并不完全了解随机森林的运作方式。
我建议阅读https://citizennet.com/blog/2012/11/10/random-forests-ensembles-and-performance-metrics/
数据中的分割以最大化分割之间的方差的方式完成。因此,如果您提到的功能具有真实的预测性,那么树木应该在某个点上分割该功能(取决于其他功能的预测能力)。
此外,sklearn中的所有树模型都具有导出拆分的功能 - 因此您可以适合树并检查发生了什么。
http://scikit-learn.org/stable/modules/generated/sklearn.tree.export_graphviz.html
统计学习要素中的第9章(可在作者网站上免费下载)如果你想了解更多,可以更深入地介绍理论。