R rpart:如果删除不太重要的变量,则不会分裂

时间:2017-10-03 18:21:51

标签: r rpart

我试图了解rpart如何在我想要完成的项目中工作。我是R的新手,但我有很多使用SAS建立各种分析模型的经验。

首先我运行了这段代码

mtree1 <- rpart(X17~., data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))

我得到一棵树,X12作为顶部分割,X10是LHS上的下一个分割,RHS上的X69,然后是该分支上的X68和X70。

接下来我运行了以下内容

mtree1 <- rpart(X17~ X12+X10+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))

我得到完全相同的树

最后我跑了

mtree1 <- rpart(X17~ X12+X69+X68+X70, data = mydata, method="class", control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 10, usesurrogate = 2, xval =10 ))

现在我根本没有分裂。 (顺便说一句,我的数据集有234144个观察值和90个独立变量,210205个货物和23839个坏货。)

这是代码和输出的图像

enter image description here

这是什么原因?我将不胜感激任何帮助。谢谢。 KK

0 个答案:

没有答案