我确实希望使用caret
调整分类算法预测概率。
由于我的数据集非常不平衡,因此Accuracy
的默认caret
选项似乎不太有用,根据这篇文章:https://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification。
在我的具体情况中,我想确定随机森林的最佳mtry
参数,该参数预测概率。我有3个班级,看上去比率为98.7% - 0.45% - 0.85%。一个可重复的例子 - 其中没有不平衡的数据集 - 由下式给出:
library(caret)
data(iris)
control = trainControl(method="CV", number=5,verboseIter = TRUE,classProbs=TRUE)
grid = expand.grid(mtry = 1:3)
rf_gridsearch = train(y=iris[,5],x=iris[-5],method="ranger", num.trees=2000, tuneGrid=grid, trControl=control)
rf_gridsearch
所以我的两个问题主要是:
Accuracy
以外的其他摘要指标吗?
(使用multiROC不是我最喜欢的,因为:https://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification。我想起了......比如布里尔得分)非常感谢!