Lucene过滤器删除重复属性

时间:2014-11-05 21:30:06

标签: lucene hibernate-search

lucene过滤器是否依赖于某些索引来删除重复结果,或者如果具有此值的文档在结果列表中,则不会触及更多文档?或其他方式来达到这个条件?

例如我有索引:

1 | a | 2
2 | b | 3
3 | c | 2
4 | d | 4

如果我的查询中有" a"," b"," c"," d"我需要在第三列得到明显的结果,所以我希望:

" b"," d",(" a" OR" c" - 只有一个,不重要哪个)因为&# 34;"和" c"在第三列上具有相同的值。

1 个答案:

答案 0 :(得分:0)

您必须按照DuplicateFilterTest.java

中的说明使用DuplicateFilter

但是过滤器有一个Bug(LUCENE-2348),只有当你的索引存储在一个段中时它才有效。所以你可能需要使用addIndexes和forceMerge(1)方法合并它。