如何在Lucene中提升链接文档?

时间:2014-01-29 20:15:38

标签: lucene

是否可以根据其他找到的文档提升找到的文档?

E.g。如果我有文件A,其中有文件B的链接,并且两者都是独立发现的,那么为了加强它们两者?通过链接我的意思是一个具有另一个文档的ID的字段。

目前我正在“手动”执行此操作,即我对TopDocs进行后期处理,以查找具有相同结果中其他文档的链接的文档,并将其移至顶部。这不是最好的解决方案,因为TopDocs本身已经受到限制而不考虑我的自定义提升。

1 个答案:

答案 0 :(得分:1)

我建议实现自定义lucene收集器或扩展现有收集器。这样,您可以存储检索到的所有文档ID,并且可以在最后对它们进行全部处理。根据您的文档之间的链接,您可以在“收集”阶段丢弃一些文档,这将节省您的记忆。