我有一些我想要细分的数据。
我的第一个想法是来自Rpart包的R中的分类树。
我的训练数据包含许多解释变量和一个名为“sold”的0-1响应变量。响应值“1”出现在大约80%的行中。
当我尝试使用rpart(sold~., training_data, method = "class")
构建树时,R无法创建树。我想原因是它找不到任何彼此差异很大的段。在快速检查数据后,我希望我的树看起来像左边节点将有85%的销售,右节点将有75%的销售。
有没有办法在这样的数据集上创建分类树?
答案 0 :(得分:1)
我有同样的问题。 这似乎是关于'cp'的问题。 请参阅我的代码:
tr1<-rpart(bad~group+amount, data=ra,
control=rpart.control(minsplit=5, cp=0.001),method='class')
当我运行它时,它有效。 当我增加cp水平(例如0.005)时,它不起作用。