应用错误收集

我在让Lucene按我期望的方式对结果评分方面遇到问题。

我希望Lucene对搜索词多次出现的文档给予更高的评分。因此，如果我有一个包含以下短语99 bottles of beer on the wall, 99 bottles of beer的文档并查询了单词beer*，那么我期望比包含beer is the way to a mans heart的另一个文档得分更高，因为第一个文档的单词为{ {1}}两次，第二个只有一次。相反，两个文档的得分都为beer。

我正在使用1和StandardAnalyzer（当我查看文档中的几个字段时）。最初尝试时没有设置任何特定的MultiFieldQueryParser算法，但我也尝试使用默认配置的Similarity以及具有自定义BM25Similarity和BM25Similarity值的k1。 / p>

在Lucene中根据单词的频率进行评分

0 个答案: