标签: python machine-learning scikit-learn classification decision-tree
我正在使用决策树进行二元分类,我有兴趣找到具有“最纯粹”分类的终端节点,对应于单个类占主导地位的输入空间的子空间。为避免过度拟合,我使用min_samples_leaf标志。
min_samples_leaf
更具体地说,我想:
我之前看到有关查找规则的帖子,但还没有弄清楚如何找到每片叶子的比例。