我正在阅读机器学习中的精确度和召回率。
问题1 :精确度和召回时间是否相反?也就是说,什么时候会出现这样的情况,你可以提高你的精确度,但代价是降低召回率,反之亦然? Wikipedia article州:
通常,精确度和召回率之间存在反比关系, 哪有可能增加一个,以减少 其他。脑外科手术提供了一个明显的权衡例子。
然而,我已经看到研究实验结果,其中精确度和召回率同时增加(例如,当您使用不同或更多功能时)。
在什么情况下反向关系成立?
问题2 :我熟悉两个领域的精确度和召回概念:信息检索(例如"从1MM页面语料库中返回100个最相关的页面&#34 ;)和二元分类(例如"将这100名患者中的每一名分类为患有或不患有疾病")。两个或其中一个领域的精度和召回是否成反比?
答案 0 :(得分:4)
只有在系统中有一些参数可以变化才能获得更多/更少的结果时,反向关系才成立。然后有一个简单的关系:你降低阈值以获得更多结果,其中一些是TP和一些FP。实际上,这并不意味着精确度或召回率会同时上升和下降 - 可以使用ROC curve来映射真实关系。至于Q2,同样,在这两个任务中,精确度和召回率不一定是反向相关的。
那么,你如何提高召回率或精确度,而不是同时影响另一个?通常,通过改进算法或模型。即当您只更改给定模型的参数时,反向关系通常会成立,但您应该注意它通常也是非线性的。但是,如果您为模型添加更多描述性功能,则可以一次性增加两个指标。
答案 1 :(得分:1)
关于第一个问题,我将这些概念解释为结果必须具有的限制性。
如果您的限制性更强,我的意思是,如果您“更多”并且要求正确性,那么#34;结果,你希望它更精确 。为此,只要您获得的所有内容都是正确的,您可能愿意拒绝一些正确的结果。因此,您提高了精确度并降低了召回率。相反,如果你不介意只要你得到所有正确的结果就不会得到一些不正确的结果,那么你就会提高召回并降低你的精确度。
关于第二个问题,如果从上述段落的角度来看,我可以说是的,它们是反向相关的。
据我所知,为了能够提高精度和召回率,您需要一个更好的模型(更适合您的问题)或更好的数据(或两者,实际上) 。