在nutch抓取的solr数据中索引时出错

时间:2012-11-17 09:56:05

标签: solr indexing runtime-error nutch

我已经开始使用nutch和solr了,我遇到了将Solr与Nutch集成的问题。我遵循了本教程:http://wiki.apache.org/nutch/NutchTutorial并在使用之后: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 nutch显示消息:

  

java.io.IOException:作业失败!

和solr显示:

  

SEVERE:org.apache.solr.common.SolrException:错误:   [doc = http://nutch.apache.org/]未知字段'host'

我认为原因可能是$ SOLR_HOME / example / solr / conf / schema.xml中缺少'host'字段但它就在那里。 我非常感谢你的帮助。

1 个答案:

答案 0 :(得分:2)

在Nutch侧更改配置不会影响Solr的架构。您必须在Solr的schema.xml中定义该字段。