我试图了解rpart如何在我想要完成的项目中工作。我是R的新手,但我有很多使用SAS建立各种分析模型的经验。
首先我运行了这段代码
mtree1 <- rpart(X17~., data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
我得到一棵树,X12作为顶部分割,X10是LHS上的下一个分割,RHS上的X69,然后是该分支上的X68和X70。
接下来我运行了以下内容
mtree1 <- rpart(X17~ X12+X10+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
我得到完全相同的树
最后我跑了
mtree1 <- rpart(X17~ X12+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))
现在我根本没有分裂。 (顺便说一句,我的数据集有234144个观察值和90个独立变量,210205个货物和23839个坏货。)
这是代码和输出的图像
这是什么原因?我将不胜感激任何帮助。谢谢。 KK