解释R输出Rpart分类树代理分裂

时间:2013-04-16 21:12:37

标签: r machine-learning classification decision-tree rpart

Surrogate splits:
    ##       bmi    < 21.51 to the right, agree=0.858, adj=0.632, (0 split)

据我所知,这种拆分根据bmi值&lt;和bmi值将病例发送到正确的子节点。 21.51并且具有与主要变量类似的分裂(一致= 0.858)和节点杂质的相当大的减少(adj = 0.632)。

我不明白输出的(0分割)片段? 此外,如果协议的值为1,这是否可疑?

谢谢!

1 个答案:

答案 0 :(得分:4)

如果你的第一个主要分裂中有10个缺失,那么rpart将尝试使用代理分割对它们进行分类。 如果你的第一个代理变量中有9个是非缺失的,则rpart将使用此变量,并且在此代理变量旁边的rpart输出中将有(9 split),因为该变量用于9个分割

如果你的代理变量也缺少数据,那么你的输出中会有(0分割)

我不知道协议的确切计算方法,但如果您的协议为 1 ,那么我猜代理变量的结果与使用时相同主要变量。 如果您的代理变量是例如主变量的单调变换版本,则可能发生这种情况。