Precision-Recall检索到的文档的值

时间:2015-05-09 16:43:15

标签: precision-recall

我正在学习精确和回忆文件,而我无法理解这个特定的问题。

下表显示了两个排名返回的前6个结果的相关性 由A和B表示的检索搜索引擎。'+'表示相关文档,' - '表示非相关文档。

enter image description here

假设集合中相关文档的总数为4,则计算两个引擎的精确召回值,分别为前1,2,3,4,5和6个结果。

为搜索引擎A提供的解决方案是:

精密: - 100% - | --50% - | --33.3% - | --25% - | --40% - | --50% - |
回忆:------ 25% - | --25% - | --25%----- | --25% - | --50% - | --75% - |

B的解决方案:

精确度: - | 100% - | --100% - | --66.6% - | --50% - | --60% - | --50% - |
回忆:---- | --- 25%--- | --50%---- | --50%----- | --50% - | --75% - | - -75% - |

我知道如何计算单个文档,并且Precsion = TP /(TP + FP)和Recall是TP /(TP + FN)。我只是不确定如何计算上面的一些值。

1 个答案:

答案 0 :(得分:1)

评论太长了。

尝试理解概念,而不是试图记住公式。

“精确度”是:结果的比例是正确的?因此,对于A和B,如果你取得最好的结果,那就是正确的。精度为100%。

“召回”是:正确结果的比例是多少?因此,对于A和B,如果取得最高结果,则您有四分之一的正确值,因此召回率为25%。