分页Lucene.Net搜索结果asp.net

时间:2012-07-12 11:39:16

标签: c# lucene.net

我想为lucene.net搜索结果做分页。当我从索引中获取数据时,我需要在每个页面中只获取10条记录。所以我搜索lucene.net分页技巧,我得到了一个我不清楚的答案。在这里......请看看。

Hits hits = searcher.search(query);
int offset = page * recordsPerPage;
int count = Math.min(hits.length() - offset, recordsPerPage);
for (int i = 0; i < count; ++i) {
    Document doc = hits.doc(offset + i);

}

TopDocs topDocs = indexSearcher.Search(query, null, 150);
for(int i=100, i<min(topDocs.totalHits,150); i++) {
Document doc = indexSearcher.doc(topDocs.scoreDocs[i]);

// Do something with the doc
}

我只需要知道有没有更好的技术。请讨论。感谢

从这里我的更新开始

我用来搜索索引的方式不同。在获取您的代码后,我试图在我的代码中使用但是收到错误。请查看我的代码并以这样的方式转换它,结果我可以使用您的分页逻辑。

这是我的代码

            int PageIndex=0;
            int PageSize=10;
            searcher = new IndexSearcher(_directory, false);
            Query qry = MultiFieldQueryParser.Parse(Version.LUCENE_29, multiWordPhrase, fieldList, occurs.ToArray(), new StandardAnalyzer(Version.LUCENE_29));
            TopDocs topDocs = searcher.Search(qry, null, ((PageIndex + 1) * PageSize), Sort.RELEVANCE);

            int resultsCount = topDocs.TotalHits;
            lblMatchFound.Text = "Match Found " + resultsCount.ToString();

            List<SearchResult> list = new List<SearchResult>();
            SearchResult oSr = null;


            if (topDocs != null)
            {
                ScoreDoc[] scoreDocs = topDocs.ScoreDocs;
                foreach (ScoreDoc scoreDoc in scoreDocs)
                {
                    Document doc = searcher.Doc(scoreDoc.doc);
                    oSr = new SearchResult();
                    oSr.ID = doc.Get("ID");
                    oSr.Title = doc.Get("Title");
                    oSr.Description = doc.Get("Description");
                    //oSr.WordCount = AllExtension.WordCount(oSr.Description, WordExist(oSr.Title, multiWordPhrase));
                    string preview =
                    oSr.Description = AllExtension.HighlightKeywords(oSr.Description, multiWordPhrase);  //sr.Description;
                    oSr.Url = doc.Get("Url");
                    list.Add(oSr);
                }
            }

请查看并重新构建我的代码,以便我可以进行分页。谢谢

1 个答案:

答案 0 :(得分:10)

首先不要使用Hits类,因为它已被弃用且速度很慢。

对于你的传呼案例:

搜索第一页,例如TopDocs td = s.Search(query, 10);

和第二页TopDocs td = s.Search(query, 20);并显示10到19的结果

依旧......

PS:Lucene中昂贵的部分是从索引中读取结果,而不是搜索本身。所以上面的技巧应该表现得非常好。

- 编辑(未经测试) -

int page = 2; //starting from 0

TopDocs td = searcher.Search(query, (page+1)*10);
for (int i = page * 10; i < (page + 1) * 10 && i < td.scoreDocs.Length; i++)
{
    Document doc = indexReader.Document(td.scoreDocs[i].doc);
}