我正在使用SPSS Modeler 16.0并尝试使用CHAID算法制作决策树,但是一个分支中连续变量的默认最大节点数是10,我希望有更多。
如何更改默认值10?
这里只有5个节点,我希望有10个节点。
答案 0 :(得分:2)
连续预测变量的分级是基于“算法指南”1第72页详细描述的算法,算法将尝试创建多达10个分箱是正确的,但是最终会有更少的数据取决于数据的实际分布和该领域的预测能力。
如果您认为应该使用不同的分级来改进模型,则可以在使用Field Ops调色板中的“Binning”节点将数据传递到模型训练器之前执行此操作。这将允许您以任何您想要的方式对字段进行分区。然后,您可以在模型中使用字段的预先分箱版本,但请记住过滤掉原始字段或将其方向设置为“无”。