R:默认截止值预测rpart将概率转化为类?

时间:2017-03-21 19:29:46

标签: r class probability rpart

我正在使用rpart包来制作预测模型。如果我使用predict函数并设置type="class",它会根据概率自动生成类。

我想知道它所基于的截止概率值,但似乎无法在任何地方找到它。

2 个答案:

答案 0 :(得分:0)

rpart基于CART,该算法在" Breiman L.,Friedman J. H.,Olshen R.A。和Stone,C.J。(1984)Classification and Regression Trees"中提出。它不使用概率来决定如何拆分节点,因此没有这样的阈值。相反,CART使用节点的杂质度量。 rpart使用Gini(默认值)或信息增益来测量杂质。您可以使用rpart.control设置 某些阈值。使用cp描述的主要是minsplit minbucketrpart.control

Breiman的书是对此的主要参考,但可以从中获得一些其他细节 Wikipedia

答案 1 :(得分:0)

它根据概率值分配类。如果它在预测1和0之间,则默认截止值为0.5,类似地,它是''根据您对响应变量的类别数量而有所不同。