我们有以下用例,这要求我们保持SOLR中的结果分数稳定:
我们评估了几个选项,但没有成功。我们的想法是用固定值覆盖doc频率。使用自定义相似性实现是不可能的,因为它太晚了"晚了"进行中。 docFreq的检索与IndexReader耦合,我没有看到覆盖某些东西的方法。最后一个选项可能是入侵分发idf缓存,即具有https://lucene.apache.org/solr/5_1_0/solr-core/org/apache/solr/search/stats/package-tree.html的自定义实现。我还没弄明白如何做到这一点以及缓存如何/在哪里与查询交互。
但主要目的是,即使添加新文档,也要保持结果分数稳定。任何暗示都会非常感激!