solr搜索所有正在检索的文档

时间:2012-03-26 03:02:09

标签: solr nutch

我使用nutch 1.4来抓取网站,并将数据索引到solr 3.5。这很成功。我用Luke检查了索引数据,发现了1678个文件。但是当我在solr界面中输入查询字符串(只是几个关键字)进行搜索时,所有1678个文档都被检索到了。这很奇怪,因为大多数检索到的网页根本不包含这些关键词。

对这个问题有任何想法吗?

谢谢。

1 个答案:

答案 0 :(得分:0)

嗯,人们在使用Solr搜索时通常会出现“丢失文档”类型的问题。你有相反的问题:)

您应该能够在使用Luke打开索引后立即了解为什么会发生这种情况。 使用Nutch模式的默认搜索字段是内容,因此当您仅在Solr中输入搜索字词时,将是要搜索的字段。使用Luke检查其内容。

您当然知道这些宝贵的资源:
http://www.lucidimagination.com/blog/2010/09/10/refresh-using-nutch-with-solr/
http://groups.drupal.org/lucene-nutch-and-solr
http://www.mail-archive.com/nutch-commits@lucene.apache.org/msg02227.html