我正在尝试使用python whoosh库通过查询实现Okapi BM25来搜索文档。
我的理解是,whoosh根据查询使用BM25计算每个文档的分数,然后对其进行排序以获得最佳结果。
我用
results = searcher.search(query)
使文档与查询最匹配。
如何获取每个文档的分数? 有没有其他方法可以获得BM25排名的分数?
答案 0 :(得分:1)
您可以使用score
属性获取计算得分:
for r in results:
print r, r.score
答案 1 :(得分:0)
您可以获得不同的得分alog或检索。
例如Tf-IDF,频率,BM25。
如果你想得分,那么这就是方法。
{{1}}