精度/召回曲线-最佳曲线和阈值

时间:2019-02-27 22:45:44

标签: r precision-recall

我希望使用Precision-Recall曲线来确定哪个阈值和哪个曲线最适合我的数据集。 (我有很多真实的负片-超过40万个)

我有预定义的阈值:1 +,2 +,3 +,4 +,5 +,10 +和预定义曲线:A,B,C。我已经为每个阈值计算了Precision / Recall的值。每条曲线,并可以在Excel中绘制图形:

enter image description here

问题

如何获取已知的Precision / Recall值并计算每条曲线的AUC?这是选择最佳曲线的最佳方法还是唯一方法?从视觉上看,红色曲线“ C”似乎是最好的-但我正在寻找一种更数学/统计的方法来确定这一点。

您找到任何给定曲线的最佳阈值是通过计算与点(1,1)相切的切线长度正确吗?该曲线的最佳阈值是切线最短的那个阈值?

谢谢, 啊

0 个答案:

没有答案