标签: data-science data-mining decision-tree
Training Set for Decision Tree
你好,社区,
我的目标是为决策树创建最佳拆分。为此,我选择了基尼系数。根据我的计算,应该是:
基尼(y <0):1-(8/8)^ 2 = 0 x <0的基尼:1-(4/8)^ 2-(4/8)^ 2 = 0.5
因此,我决定将第一个拆分y <0称为Gini索引较小。那是对的吗? 但是现在我无法再继续了。正确的决策树是什么样子,其准确性是什么?
非常感谢,我已经很困惑了:)