SolR限制每个文件的命中数

时间:2010-11-11 14:01:13

标签: java lucene solr

我有一个SolR索引,其中每条记录都是一个文件中的页面。因此,对于每条记录,我们都有完整的文本,页码和文件ID。

当我们进行搜索时,通常单个文件会压倒结果,因为它会反复包含搜索词。

我想要做的是让搜索查询每个文档最多只返回两次点击,然后向用户提供“查看此文档中的更多点击”,这将执行另一个更有限的查询。即类似于Google只会向您显示来自任何特定域的一些结果,并且可以选择从每个域中查看更多结果。

无论如何构造SolR查询来实现这个目标吗?

1 个答案:

答案 0 :(得分:1)

您使用的是哪个solr版本?如果它是4.0(即每晚),那么你可以在文件名字段上使用collapsing