根据字段中的标记数对Solr结果进行排序

时间:2015-05-05 09:08:05

标签: sorting solr frequency term scoring

如果之前有人问过这个问题,我会道歉 - 我进行了搜索,无法找到我要找的东西。

我正在寻找一种方法来根据特定字段中的令牌数量对一组Solr结果进行排序或评分,并希望忽略重复的令牌 - 所讨论的字段是一个可以包含一个或多个令牌的文本字段。

我认为需要一个例子:

我们假设我们有一个名为color的文本字段,我们有一堆文档:

doc1 - colour: red, red, green, blue, yellow
doc2 - colour: red, green, blue
doc3 - colour: blue, yellow, yellow
doc4 - colour: green
doc5 - colour: red, green

如果我搜索颜色:绿色,我希望看到这样的结果:

doc4, doc5, doc2, doc1

所以它正在查看匹配的令牌和字段中的令牌数量:

doc1将获得100%得分,因为绿色是唯一的标记,doc5得分为50%,因为有两个标记,其中一个匹配,doc2得分为33.333%,因为匹配的标记相当于三分之一等等...

我如何在查询时根据上述内容进行评分/排序?

提前致谢, 尼克

0 个答案:

没有答案