有Lucene BM25相似性的解释吗?

时间:2018-06-20 14:27:25

标签: lucene similarity

有一个简单的解释吗?我想从代码BM25Similarity Github理解它吗?如果答案是肯定的,那么IndexSearcher调用文档评分的方法是什么?

Lucene BM25的实现与文献中的实现是否相等?

我的意思是等于:

tf /(k1 *(1-b)+ b *(dl / avdl)+ tf)

1 个答案:

答案 0 :(得分:0)

是的,这是来自this link中的文献中BM25的实现。请注意,您提供的公式缺少IDF组件。参数设置为k1 = 1.2 b = 0.75。

要了解Lucene的评分机制,您可以随时调用explain()函数。有关更多信息,请参见here