我已经开始使用nutch和solr了,我遇到了将Solr与Nutch集成的问题。我遵循了本教程:http://wiki.apache.org/nutch/NutchTutorial并在使用之后:
bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5
nutch显示消息:
java.io.IOException:作业失败!
和solr显示:
SEVERE:org.apache.solr.common.SolrException:错误: [doc = http://nutch.apache.org/]未知字段'host'
我认为原因可能是$ SOLR_HOME / example / solr / conf / schema.xml中缺少'host'字段但它就在那里。 我非常感谢你的帮助。
答案 0 :(得分:2)
在Nutch侧更改配置不会影响Solr的架构。您必须在Solr的schema.xml中定义该字段。