我在让Lucene按我期望的方式对结果评分方面遇到问题。
我希望Lucene对搜索词多次出现的文档给予更高的评分。因此,如果我有一个包含以下短语99 bottles of beer on the wall, 99 bottles of beer
的文档并查询了单词beer*
,那么我期望比包含beer is the way to a mans heart
的另一个文档得分更高,因为第一个文档的单词为{ {1}}两次,第二个只有一次。相反,两个文档的得分都为beer
。
我正在使用1
和StandardAnalyzer
(当我查看文档中的几个字段时)。最初尝试时没有设置任何特定的MultiFieldQueryParser
算法,但我也尝试使用默认配置的Similarity
以及具有自定义BM25Similarity
和BM25Similarity
值的k1
。 / p>