更准确,我在哪里可以找到决定文档是否与给定查询相关的代码
我将非常感谢指导
答案 0 :(得分:2)
结果的问题在于Lucene不是全部收集,而是仅收集N个顶级结果(N由您设置)。这是一个好主意,因为它大大缩短了搜索过程的时间,只产生了您可能感兴趣的结果。虽然您可以将N设置为某个非常大的数字,但在查询中对每个术语进行一次搜索然后合并结果,我实际上不建议这样做。
另一方面,您可以在搜索之前合并,而不是之后。我不熟悉zig-zag join,但很可能你必须为查询创建新语法并强制QueryParser
使用你的ZigZagQuery
(或任何你称之为的它)。有关实现的示例,请参阅Query subclasses源代码。