我正在处理一个项目,我需要根据导入R的数据集制作决策树。数据集包含155个观察值和24个属性+类。我使用rpart包创建了一个树。然而,树出来很简单,只有一个分裂(像倒置的V)。我尝试了各种rpart.control组合,但没有任何效果。我怀疑我的树只使用了一个观察点,这就是为什么树很简单的原因。任何想法如何解决它将不胜感激:)这是我的代码:
tree_01<-rpart(data=training.data, formula=class~.) #,control=rpart.control(minsplit=5))
答案 0 :(得分:1)
尝试使用较小的复杂性参数cp
,默认设置为0.01。它必须在?rpart.control
定义。
如何使用它的示例:
rpart(formula, data, control = rpart.control(cp = 0.001))