在Lucene中根据单词的频率进行评分

时间:2019-08-04 06:48:53

标签: java nlp lucene

我在让Lucene按我期望的方式对结果评分方面遇到问题。

我希望Lucene对搜索词多次出现的文档给予更高的评分。因此,如果我有一个包含以下短语99 bottles of beer on the wall, 99 bottles of beer的文档并查询了单词beer*,那么我期望比包含beer is the way to a mans heart的另一个文档得分更高,因为第一个文档的单词为{ {1}}两次,第二个只有一次。相反,两个文档的得分都为beer

我正在使用1StandardAnalyzer(当我查看文档中的几个字段时)。最初尝试时没有设置任何特定的MultiFieldQueryParser算法,但我也尝试使用默认配置的Similarity以及具有自定义BM25SimilarityBM25Similarity值的k1。 / p>

0 个答案:

没有答案