我正在使用rpart
包来制作预测模型。如果我使用predict
函数并设置type="class"
,它会根据概率自动生成类。
我想知道它所基于的截止概率值,但似乎无法在任何地方找到它。
答案 0 :(得分:0)
rpart
基于CART,该算法在" Breiman L.,Friedman J. H.,Olshen R.A。和Stone,C.J。(1984)Classification and Regression Trees"中提出。它不使用概率来决定如何拆分节点,因此没有这样的阈值。相反,CART使用节点的杂质度量。 rpart
使用Gini(默认值)或信息增益来测量杂质。您可以使用rpart.control
设置 某些阈值。使用cp
描述的主要是minsplit
minbucket
和rpart.control
。
Breiman的书是对此的主要参考,但可以从中获得一些其他细节 Wikipedia
答案 1 :(得分:0)
它根据概率值分配类。如果它在预测1和0之间,则默认截止值为0.5,类似地,它是''根据您对响应变量的类别数量而有所不同。