根据相关性和类别对solr结果进行评分

时间:2011-12-13 11:23:20

标签: sorting solr mixing weighted

我们正在使用Solr 1.4为用户查询生成结果。结果从包含大约500k文档的索引中获取。索引不断更新,新文档和旧文档到期。

结果页面是按相关性(得分)排序的文档列表,由solr根据用户的查询自动计算。每个文档属于一个类别(例如工程,财务,管理,数学等),类别ID由Solr存储和索引。

我们想要实现的是文档按相关性排序,但也要以某种方式加权,以便至少第一页结果(10,20或50)包含尽可能多的类别的文档和很少有相同类别的文件是连续的。

我们搜索了很多,但没有设法提出任何可行的方案。

非常感谢任何想法。 GK

1 个答案:

答案 0 :(得分:1)

据我所知,这在Solr中是不可能的。我的意思是,如果搜索术语更适用于工程项目而不是其他任何内容,那么您需要根据搜索结果以不同方式人为地提升其他类别。

您可以使用field collapsing在最新版本中执行与此类似的操作。即您只能从某个类别获得X个点击次数,然后点击“更多像这样”的链接。

或者,您可以进行多次搜索,每种类别一次,并自行“混合”。