为什么lucene不返回索引中的所有文件?

时间:2016-07-29 04:29:17

标签: java lucene

我正在使用Lucene 5.3来索引一组文档并使用BooleanQuery,其中查询中的每个术语都会被某个分数提升。

我的问题是,当我搜索索引时,我获得的文档数量少于我的索引中的文档数量。

    System.out.println( "docs in the index = " + reader.numDocs() );
     //e.g., docs in the index = 92
    TopDocs topDocs = indexSearcher.search( q, reader.numDocs() ); //this ensures no result is omitted from the search.
    ScoreDoc[] hits = topDocs.scoreDocs;
    System.out.println( "results found: " + topDocs.totalHits )
    //e.g., results found: 44

这种行为的原因是什么? lucene是否会忽略零分的文档?

无论得分如何,我如何获得索引中的所有文件?

1 个答案:

答案 0 :(得分:0)

Lucene只返回与查询实际匹配的结果。如果您想将所有文档作为结果,您需要确保它们都匹配。您可以使用MatchAllDocsQuery

执行此操作
Query query = new BooleanQuery.Builder()
        .add(new BooleanClause(new MatchAllDocsQuery(), BooleanClause.Occur.MUST))
        .add(new BooleanClause(myOldQuery, BooleanClause.Occur.SHOULD))
        .build();