我能将Apache Nutch爬虫与Solr索引服务器集成吗?
修改
我们的一位开发人员提出了这些帖子的解决方案
答案 0 :(得分:6)
如果您愿意升级到nutch 1.0,可以使用Lucid Imagination撰写的文章中描述的solrindex:http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/。
答案 1 :(得分:1)
它仍然是open issue。如果您有冒险精神,可以尝试自己应用这些补丁,尽管它看起来像it's not so simple
答案 2 :(得分:1)
nutch 2.x旨在使用solr作为默认值。您可以按照http://wiki.apache.org/nutch/Nutch2Tutorial中的步骤操作,或者使用Apache Nutch"#34; Web爬网和数据挖掘一书中的更好说明。