我实际上是在逐步计算CART(分类和回归树)如何使用此训练数据集选择最佳属性:
Car Age Children Location
1 sedan 23 0 yes
2 sports 31 1 no
3 sedan 36 1 no
4 truck 25 2 no
5 sports 30 0 no
6 sedan 36 0 no
7 sedan 25 0 yes
8 truck 36 1 no
9 sedan 30 2 yes
10 sedan 31 1 yes
11 sports 25 0 no
12 truck 45 0 yes
R给出的结果:
对于根节点Gini(root)= 0.486
我的第一个问题是为什么在这个情节中我得到了分裂的Car属性?
这是我的第二个问题,CART如何设法选择具有这两个值的split属性?