决策树如何处理连续值属性?我知道sex
等属性会有2个弧,表示male
或female
。但是如age
这样的连续值属性呢?不可能为每个可能的值创建弧线?它会创建年龄范围集吗?例如,有3个子分支标记为<18
,<30
,>30
?如果是这样,它如何决定这些年龄组的创建?
答案 0 :(得分:0)
某些算法(如CART)使用基尼指数或其他杂质函数评估所有可能的拆分。 您只需对属性进行排序,然后查看每个分割的杂质。 该方法的缺点是它很贪婪,你需要看看每一个可能的分裂。 See image here.