返回Lucene文档中字段的Top-k命中

时间:2012-05-28 12:41:29

标签: lucene

我有一个Lucene索引,由每个包含两个字段F1和F2的文档组成。我在F1上进行搜索,并为排名前k的文档收集F2。我使用IndexSearcher接口。 在我的结果中,有很多重复的F2值,我可以要求top-k超过唯一的F2值吗?

1 个答案:

答案 0 :(得分:0)

在散列集中添加F2值,然后在重复检查(使用链接)中,在结果对象中添加字段值对...这样您的结果对象就不会有重复值......

http://docs.oracle.com/javase/6/docs/api/java/util/HashSet.html#add%28E%29