Question

在计算混淆矩阵时是否有任何方法可以选择最佳阈值，以便最大限度地减少误报和漏报的数量（以获得最佳组合）？

直到现在我已经尝试手动更改阈值，但这太累了。

提前致谢。

Answer 1

您可以使用WEKA来优化阈值。当模型的精度最高时，将达到最佳阈值。否则，您也可以使用ROC曲线

Answer 2

我从某处复制了此代码以获得最佳阈值。我认为它给出了这里的要求：

pred <- prediction(data$predicted_values, data$observations)
ss <- performance(pred, "sens", "spec")
plot(ss)
best_threshold <- ss@alpha.values[[1]][which.max(ss@x.values[[1]]+ss@y.values[[1]])]

希望它能提供帮助

在计算混淆矩阵时选择最佳阈值？

2 个答案: