在计算混淆矩阵时选择最佳阈值?

时间:2014-08-21 10:37:16

标签: r threshold confusion-matrix r-caret

在计算混淆矩阵时是否有任何方法可以选择最佳阈值,以便最大限度地减少误报和漏报的数量(以获得最佳组合)?

直到现在我已经尝试手动更改阈值,但这太累了。

提前致谢。

2 个答案:

答案 0 :(得分:0)

您可以使用WEKA来优化阈值。当模型的精度最高时,将达到最佳阈值。否则,您也可以使用ROC曲线

答案 1 :(得分:0)

我从某处复制了此代码以获得最佳阈值。我认为它给出了这里的要求:

pred <- prediction(data$predicted_values, data$observations)
ss <- performance(pred, "sens", "spec")
plot(ss)
best_threshold <- ss@alpha.values[[1]][which.max(ss@x.values[[1]]+ss@y.values[[1]])]

希望它能提供帮助