在Python上使用scikit.learn获取信息

时间:2014-07-23 09:13:27

标签: python scikit-learn decision-tree entropy

我有这个问题,因为我在Python上使用scikit.learn处理决策树。我希望获得更好的叶子来选择决策树的深度。

clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)

所以这是我的决策树功能,我的目标是选择正确的信息增益阈值以获得更好的结果。默认信息增益阈值为零,因此具有信息增益的特征>选择为零。

我想将信息增益阈值设置为优于specefic数字。我怎么能这样做?

1 个答案:

答案 0 :(得分:0)

据我了解你的问题,现在不支持。在寻找分裂时,不能设置减少杂质的下限。即使改善接近于0,它总是最大化所选择的减少量。