有两种构建决策树的算法,例如CART(分类和回归树),ID3(迭代二分法器3)等
默认情况下,scikit-learn使用哪种决策树算法?
当我看一些决策树python脚本时,它会神奇地通过fit
和predict
函数产生结果。
scikit-learn是否根据数据巧妙地选择了最佳决策树算法?
答案 0 :(得分:2)
它不会自动这样做。
如果我们查看sklearn.tree.DecisionTreeClassifier页,则可以看到默认标准是基尼杂质。
还有一个选项可以使用熵代替标准。
请注意,CART使用基尼杂质,而ID3使用熵作为分离标准。
答案 1 :(得分:1)
他们实际上使用CART,但分裂标准既是基尼系数又是熵。您可以查看How to tune a Decision Tree?,了解幕后情况。