我对R中rpart分类树的输出有疑问。如果缺少值,则使用代理分割。这是一个例子。
Surrogate splits:
## bmi < 21.51 to the right, agree=0.858, adj=0.632, (0 split)
协议是否计算为代理人分割与主要分割同意的案例的比例?例如,如果代理人未能就4个数据点中只有1个达成一致,则该协议将为.75。它是否正确?
此外,我不确定我对adj的解释。这是经过调整的协议,考虑到偶然的协议?如果是这样,这是如何计算的?我认为这必须与数据中的先验有关,但我不确定。
任何见解都表示赞赏。提前谢谢。
答案 0 :(得分:0)
你对协议计算是正确的。 adj是节点杂质的减少。这是参考rpart的主要分裂。 adj越高,代理分裂的考虑越好。这就是我的理解。如果有人加入,那就太棒了。