Nutch关键字搜索无法检索包含该关键字的所有页面

时间:2013-06-20 02:04:35

标签: java lucene nutch keyword-search

我正在使用Nutch和Lucene(java API)进行网站关键字搜索。我的问题是Nutch无法分配包含所需关键字的所有页面。例如。我有一个名为“Luxury Bag”的产品,如果我搜索“Luxury”,我没有得到产品的结果,如果我找到“Luxury Bag”我找到了它。我花了一个多星期的时间来处理这些错误,根本不知道。另外,我用Luke程序测试了我的爬行数据。它完全适用于Luke,但不适用于我的java代码。任何人都可以建议我。任何建议都是受欢迎和赞赏的。感谢。

1 个答案:

答案 0 :(得分:0)

我刚刚解决了这个问题。

Query query = Query.parse(searchQuery, conf);
QueryParams queryParams = new QueryParams();
queryParams.setMaxHitsPerDup(100);
queryParams.setNumHits(100);
query.setParams(queryParams);
Hits hits = bean.search(query);
long allResultsCount =**hits.getTotal());**

我将其改为

long allResultsCount =**hits.getLength());**