我有两个问题
1-什么是“11pt平均精度指标”?
2-如何在信息检索中使用它?
由于
答案 0 :(得分:16)
主要来自Christopher D. Manning,Prabhakar Raghavan和HinrichSchütze的书“Introduction to Information Retrieval”。
在排名检索中,您具有精确度和召回率。精确度是系统返回的文档的准确程度(1.0表示它只返回相关文档)。召回是系统找到的相关文件的百分比(1.0表示它们全部找到)。因此,您可以通过返回越来越多的文档来调整系统的调用,但是需要进行精确折衷,因为您可能会承认更多错误。
插值精度是您选择召回级别r和所有召回级别P(r')> = P(r)的位置,其中P(r)是级别r
的精度。这是您可以达到的最佳精度。
然后在11-pt插值平均精度中,您将查看11个调用级别(0.0,0.1,0.2,...,1.0)并在每个点找到插值精度。您可以在所有不同的查询或信息需求中平均这些分数(正如Manning& Schuetze所说的那样)来查找系统的分数。
信息检索的典型用法是评估。它可以帮助您将一个系统与另一个系统进行比较,但它确实有助于您在调整参数时比较系统的变化情况。更改此设置是否会改善或损坏我的11-pt interp avg prec?它的好处是,它可以测量您收藏中的所有信息需求,因此有助于为您提供“全局”视图。但是,要小心过度依赖这些指标,因为它们只与您使用的评估集一样好。
答案 1 :(得分:1)
您应该参考Salton& Sons出版的“现代信息检索简介”一书。麦吉尔。以下在线参考有一个很好的指标摘要,它的用途和算法:
答案 2 :(得分:1)
这是一本在线图书Introduction to Information Retrieval
,并且提到了11点插值平均精度使用,evaluation of ranked retrieval results.
答案 3 :(得分:-1)
有时候我想知道为什么人们会问这样的问题,谷歌可以比许多人更好地回答这些问题。然后谷歌引导我去this维基百科的文章,我淹死的是公式和密码定义的术语。
据我所知,11点平均精度是对自动化系统对一组文档进行分类的评估。因此它与信息检索相关,因为它为您提供了评估(例如)搜索引擎有用性的指标。
所以,如果你能理解那篇文章,那就是你的答案。否则,这里希望你和我得到有人向我们解释的好处: - )
祝你好运。