我正在使用Lucene 5.3来索引一组文档并使用BooleanQuery
,其中查询中的每个术语都会被某个分数提升。
我的问题是,当我搜索索引时,我获得的文档数量少于我的索引中的文档数量。
System.out.println( "docs in the index = " + reader.numDocs() );
//e.g., docs in the index = 92
TopDocs topDocs = indexSearcher.search( q, reader.numDocs() ); //this ensures no result is omitted from the search.
ScoreDoc[] hits = topDocs.scoreDocs;
System.out.println( "results found: " + topDocs.totalHits )
//e.g., results found: 44
这种行为的原因是什么? lucene是否会忽略零分的文档?
无论得分如何,我如何获得索引中的所有文件?
答案 0 :(得分:0)
Lucene只返回与查询实际匹配的结果。如果您想将所有文档作为结果,您需要确保它们都匹配。您可以使用MatchAllDocsQuery
:
Query query = new BooleanQuery.Builder()
.add(new BooleanClause(new MatchAllDocsQuery(), BooleanClause.Occur.MUST))
.add(new BooleanClause(myOldQuery, BooleanClause.Occur.SHOULD))
.build();