如何在CART决策树算法中拆分连续属性?

时间:2010-12-09 23:59:24

标签: algorithm graph-algorithm

我不了解如何在CART(分类和回归树)算法中拆分连续属性,因为我们知道CART可以分割分类和连续属性。

我已阅读了很多论文,它说分割点的值是顺序的中间值。 我不明白。你能告诉我这意味着什么,并举一些例子吗?

谢谢

1 个答案:

答案 0 :(得分:1)

一般过程是扫描任何给定预测变量的候选分割值,测量每个分割的质量并选择最佳分割值。为了效率,扫描可能不会尝试每一个可能的分裂,而是尝试每个百分位或一些其他减少的选择。任何分割的质量都可以通过多种方式测量,例如信息增益,双重等等。

如果你特别谈论最初由Breiman,Friedman,Stone Olshen描述的CART算法,那么请查看他们的书“分类和回归树”(1984)。