Solr云评分发生在分片内部而不是整体集合中

时间:2017-04-21 14:09:52

标签: solr cloud

在solr中,云计分在分片中计算。

我有一个集合和两个分片。我在shard1中有110个文档,在碎片2中有90个文档与字段名称匹配:John

文档的solr评分与分片不同,我需要solr来计算整体集合中的文档得分,而不是分片和合并。

例如:搜索John返回2条完全匹配的记录,分数为3.2和2.2。有没有办法根据集合而不是碎片进行评分

2 个答案:

答案 0 :(得分:1)

您必须在solrconfig.xml中启用This,如下所示:

<statsCache class="org.apache.solr.search.stats.ExactStatsCache"/>

默认情况下,Solr仅使用本地统计信息,这将使Solr使用全局统计数据进行评分,并应解决您的问题。

答案 1 :(得分:1)

您对分布式IDF感兴趣[1]。 这将允许您基于相同的IDF在不同的分片中精确地对文档进行评分。

请记住,即使在这种情况下&#34;完全匹配的文件&#34;可以有不同的分数: 1)不同的场长 2)所涉及的术语的不同术语频率 3)不同的提升(如果适用)

干杯 [1] https://cwiki.apache.org/confluence/display/solr/Distributed+Requests