我有这个问题,因为我在Python上使用scikit.learn处理决策树。我希望获得更好的叶子来选择决策树的深度。
clf = tree.DecisionTreeClassifier(criterion="entropy", max_depth=4, min_samples_leaf=50000)
所以这是我的决策树功能,我的目标是选择正确的信息增益阈值以获得更好的结果。默认信息增益阈值为零,因此具有信息增益的特征>选择为零。
我想将信息增益阈值设置为优于specefic数字。我怎么能这样做?
答案 0 :(得分:0)
据我了解你的问题,现在不支持。在寻找分裂时,不能设置减少杂质的下限。即使改善接近于0,它总是最大化所选择的减少量。