插入符号中多类分类的替代性能指标

时间:2017-09-28 20:54:52

标签: r r-caret multiclass-classification

我确实希望使用caret调整分类算法预测概率。 由于我的数据集非常不平衡,因此Accuracy的默认caret选项似乎不太有用,根据这篇文章:https://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification

在我的具体情况中,我想确定随机森林的最佳mtry参数,该参数预测概率。我有3个班级,看上去比率为98.7% - 0.45% - 0.85%。一个可重复的例子 - 其中没有不平衡的数据集 - 由下式给出:

library(caret)
data(iris)


control = trainControl(method="CV", number=5,verboseIter = TRUE,classProbs=TRUE)

grid = expand.grid(mtry = 1:3)
rf_gridsearch = train(y=iris[,5],x=iris[-5],method="ranger", num.trees=2000, tuneGrid=grid, trControl=control)
rf_gridsearch

所以我的两个问题主要是:

  1. 我有Accuracy以外的其他摘要指标吗? (使用multiROC不是我最喜欢的,因为:https://stats.stackexchange.com/questions/68702/r-caret-difference-between-roc-curve-and-accuracy-for-classification。我想起了......比如布里尔得分)
  2. 我如何实施它们?
  3. 非常感谢!

0 个答案:

没有答案