我希望使用Precision-Recall曲线来确定哪个阈值和哪个曲线最适合我的数据集。 (我有很多真实的负片-超过40万个)
我有预定义的阈值:1 +,2 +,3 +,4 +,5 +,10 +和预定义曲线:A,B,C。我已经为每个阈值计算了Precision / Recall的值。每条曲线,并可以在Excel中绘制图形:
问题
如何获取已知的Precision / Recall值并计算每条曲线的AUC?这是选择最佳曲线的最佳方法还是唯一方法?从视觉上看,红色曲线“ C”似乎是最好的-但我正在寻找一种更数学/统计的方法来确定这一点。
您找到任何给定曲线的最佳阈值是通过计算与点(1,1)相切的切线长度正确吗?该曲线的最佳阈值是切线最短的那个阈值?
谢谢, 啊