我想为lucene.net搜索结果做分页。当我从索引中获取数据时,我需要在每个页面中只获取10条记录。所以我搜索lucene.net分页技巧,我得到了一个我不清楚的答案。在这里......请看看。
Hits hits = searcher.search(query);
int offset = page * recordsPerPage;
int count = Math.min(hits.length() - offset, recordsPerPage);
for (int i = 0; i < count; ++i) {
Document doc = hits.doc(offset + i);
}
TopDocs topDocs = indexSearcher.Search(query, null, 150);
for(int i=100, i<min(topDocs.totalHits,150); i++) {
Document doc = indexSearcher.doc(topDocs.scoreDocs[i]);
// Do something with the doc
}
我只需要知道有没有更好的技术。请讨论。感谢
我用来搜索索引的方式不同。在获取您的代码后,我试图在我的代码中使用但是收到错误。请查看我的代码并以这样的方式转换它,结果我可以使用您的分页逻辑。
int PageIndex=0;
int PageSize=10;
searcher = new IndexSearcher(_directory, false);
Query qry = MultiFieldQueryParser.Parse(Version.LUCENE_29, multiWordPhrase, fieldList, occurs.ToArray(), new StandardAnalyzer(Version.LUCENE_29));
TopDocs topDocs = searcher.Search(qry, null, ((PageIndex + 1) * PageSize), Sort.RELEVANCE);
int resultsCount = topDocs.TotalHits;
lblMatchFound.Text = "Match Found " + resultsCount.ToString();
List<SearchResult> list = new List<SearchResult>();
SearchResult oSr = null;
if (topDocs != null)
{
ScoreDoc[] scoreDocs = topDocs.ScoreDocs;
foreach (ScoreDoc scoreDoc in scoreDocs)
{
Document doc = searcher.Doc(scoreDoc.doc);
oSr = new SearchResult();
oSr.ID = doc.Get("ID");
oSr.Title = doc.Get("Title");
oSr.Description = doc.Get("Description");
//oSr.WordCount = AllExtension.WordCount(oSr.Description, WordExist(oSr.Title, multiWordPhrase));
string preview =
oSr.Description = AllExtension.HighlightKeywords(oSr.Description, multiWordPhrase); //sr.Description;
oSr.Url = doc.Get("Url");
list.Add(oSr);
}
}
请查看并重新构建我的代码,以便我可以进行分页。谢谢
答案 0 :(得分:10)
首先不要使用Hits
类,因为它已被弃用且速度很慢。
对于你的传呼案例:
搜索第一页,例如TopDocs td = s.Search(query, 10);
和第二页TopDocs td = s.Search(query, 20);
并显示10到19的结果
依旧......
PS:Lucene中昂贵的部分是从索引中读取结果,而不是搜索本身。所以上面的技巧应该表现得非常好。
- 编辑(未经测试) -
int page = 2; //starting from 0
TopDocs td = searcher.Search(query, (page+1)*10);
for (int i = page * 10; i < (page + 1) * 10 && i < td.scoreDocs.Length; i++)
{
Document doc = indexReader.Document(td.scoreDocs[i].doc);
}