使用Nutch履带与Solr

时间:2008-10-17 08:32:39

标签: lucene solr nutch

我能将Apache Nutch爬虫与Solr索引服务器集成吗?

修改

我们的一位开发人员提出了这些帖子的解决方案

  1. Running Nutch and Solr
  2. Update for Running Nutch and Solr
  3. 答案

3 个答案:

答案 0 :(得分:6)

如果您愿意升级到nutch 1.0,可以使用Lucid Imagination撰写的文章中描述的solrindex:http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/

答案 1 :(得分:1)

它仍然是open issue。如果您有冒险精神,可以尝试自己应用这些补丁,尽管它看起来像it's not so simple

答案 2 :(得分:1)

nutch 2.x旨在使用solr作为默认值。您可以按照http://wiki.apache.org/nutch/Nutch2Tutorial中的步骤操作,或者使用Apache Nutch"#34; Web爬网和数据挖掘一书中的更好说明。