在solr中,云计分在分片中计算。
我有一个集合和两个分片。我在shard1中有110个文档,在碎片2中有90个文档与字段名称匹配:John
文档的solr评分与分片不同,我需要solr来计算整体集合中的文档得分,而不是分片和合并。
例如:搜索John返回2条完全匹配的记录,分数为3.2和2.2。有没有办法根据集合而不是碎片进行评分
答案 0 :(得分:1)
您必须在solrconfig.xml中启用This,如下所示:
<statsCache class="org.apache.solr.search.stats.ExactStatsCache"/>
默认情况下,Solr仅使用本地统计信息,这将使Solr使用全局统计数据进行评分,并应解决您的问题。
答案 1 :(得分:1)
您对分布式IDF感兴趣[1]。 这将允许您基于相同的IDF在不同的分片中精确地对文档进行评分。
请记住,即使在这种情况下&#34;完全匹配的文件&#34;可以有不同的分数: 1)不同的场长 2)所涉及的术语的不同术语频率 3)不同的提升(如果适用)
干杯 [1] https://cwiki.apache.org/confluence/display/solr/Distributed+Requests