使用rpart包时控制预测变量的分割数

时间:2014-09-12 18:23:55

标签: r decision-tree rpart

我第一次使用决策树模型,我不确定运行树的输出是否符合预期。数据集中有超过700个预测变量。

我使用了rpart包并发出以下声明:

data_rpart <- rpart(GOOD~.,data=data_Train)

输出显示2个关键的预测变量(24个月内的交易和12个月的访问),如下所示:     规则编号:4 [GOOD = 0.0735211267605634封面= 10650(72%)]         trans_24mth&LT; 4.5         trans_24mth&LT; 2.5

Rule number: 5 [GOOD=0.214780600461894 cover=2165 (15%)]
     trans_24mth< 4.5
     trans_24mth>=2.5

Rule number: 7 [GOOD=0.511111111111111 cover=990 (7%)]
     trans_24mth>=4.5
     visit_12mth>=10.5

Rule number: 6 [GOOD=0.307862679955703 cover=903 (6%)]
     trans_24mth>=4.5
     visit_12mth< 10.5

从SAS中的早期逻辑回归模型中,我知道这些变量与模型相关。

我的问题是我们是否可以控制模型中显示的变量数量?现在从700个变量看来只有2个变量出现了。有没有办法让我们强制rpart语句在规则中显示更多变量?这个只显示事务变量作为预测变量;但是我想知道数据集中的人口统计/心理变量是否也在识别模型中的好/坏方面发挥作用? 在此先感谢您的帮助

0 个答案:

没有答案