检索到少于k个文档时的k精度

时间:2017-09-22 23:19:24

标签: information-retrieval

在信息检索评估中,如果检索的文档少于k个,那么精度@ k会是多少?假设只检索了5个文档,其中3个是相关的。精度@ 10是3/10还是3/5?

1 个答案:

答案 0 :(得分:5)

很难找到定义这类措施的边缘情况的文本,而数学公式通常不会处理数据的不完整性。对于这样的问题,我倾向于转向trec_eval做出的决定,NIST分发的工具具有所有常见检索措施的实现,尤其是文本检索会议(TREC挑战)中的挑战所使用的工具。 / p>

根据trec_eval 9.0m_P.c中的指标描述(在本页上称为最新内容):

Precision measured at various doc level cutoffs in the ranking.
If the cutoff is larger than the number of docs retrieved, then
it is assumed nonrelevant docs fill in the rest.  Eg, if a method
retrieves 15 docs of which 4 are relevant, then P20 is 0.2 (4/20).
Precision is a very nice user oriented measure, and a good comparison
number for a single topic, but it does not average well. For example,
P20 has very different expected characteristics if there 300
total relevant docs for a topic as opposed to 10.

这意味着即使检索到的k少于k,也应始终除以k,因此在特定情况下精度将为0.3而不是0.6。 (惩罚系统以检索少于k)。

另一个棘手的情况是,相关文件少于k。这就是为什么他们注意到精确度是一个有用的衡量标准,但不能很好地平均。

对这些问题更加健全的一些措施是:归一化折扣累积增益(NDCG),将排名与理想排名(截止时间)和(更简单)R-Precision进行比较:计算相关数量的精度文件,而不是固定的{{1}}。因此,对于R = 15,一个查询可以计算P @ 15,而对于R = 200,另一个可以计算P @ 200。