我知道我们可以为分类和回归树(CART)(二叉树)在不同级别上多次拆分数字属性。类别属性如何?我们可以分裂多次还是只能分裂一次?如果没有,原因是什么?
答案 0 :(得分:0)
二叉树是二叉树。
如果您进行多路拆分,那么它不再是二进制的,找到最佳拆分变得比您想要的更昂贵,而与使用多个级别相比,整体功能并没有改变。
答案 1 :(得分:0)
如果类别预测变量具有两个以上类别;您可以像处理数字变量一样再次拆分。
例如;
如果预测因素之一是“婚姻状况”(分为3个类别):“已婚”,“未婚”和“离婚”。
您可以进行一个二进制拆分,例如“未婚”与“其他” ,其中后一组包括对“已婚”和“离婚”的观察。
此外,如果需要,可以将“其他”组分为两个类别:“ <已婚”和“已婚” 。
根据某些划分规则,您也可以将此想法扩展到3个以上的类别。