决策树&连续值属性

时间:2014-03-06 11:48:00

标签: attributes tree continuous

决策树如何处理连续值属性?我知道sex等属性会有2个弧,表示malefemale。但是如age这样的连续值属性呢?不可能为每个可能的值创建弧线?它会创建年龄范围集吗?例如,有3个子分支标记为<18<30>30?如果是这样,它如何决定这些年龄组的创建?

1 个答案:

答案 0 :(得分:0)

某些算法(如CART)使用基尼指数或其他杂质函数评估所有可能的拆分。 您只需对属性进行排序,然后查看每个分割的杂质。 该方法的缺点是它很贪婪,你需要看看每一个可能的分裂。 See image here.