我正在尝试使用Nutch(v 1.7)和Solr(v 4.3.1)。我正在学习本教程:http://wiki.apache.org/nutch/NutchTutorial
我对step 6感到困惑,我被告知要将Nutch模式文件复制到Solr的目录中。
6。 Solr与Nutch集成
我们已正确安装和设置Nutch和Solr。和Nutch 已经从种子URL创建了爬网数据。以下是步骤 将搜索委托给Solr以获取可搜索的链接:
cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME} /示例/ solr的/ CONF /
问题是${APACHE_SOLR_HOME}/example/solr/conf/
不存在。 /example/solr/
仅包含
README.txt
bin
collection1
solr.xml
zoo.cfg
有谁知道怎么办?我应该创建 ./example/solr/conf
目录并将Nutch文件复制到该目录吗?
非常感谢你的帮助。
答案 0 :(得分:5)
由于您使用的是Solr 4.x,因此您可以在collection1中使用conf,您应该可以执行以下操作:
cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/collection1/conf/
答案 1 :(得分:1)
我认为我的错误是在这个特别的Nutch教程中使用了Solr的4.3.1版本。 Solr的早期版本(如3.6.2)有一个conf
目录,教程表明应该这样做。我认为本教程是用v 3.6.2编写的。
我已切换到Solr v.3.6.2,现在情况更顺利。
答案 2 :(得分:1)
我正在尝试将Apache Nutch 1.7与Apache Solr 3.6.2集成,并且就在你提到的那一行之后就有了这一行:
Copy exactly in 351 line:
<field name="_version_" type="long" indexed="true" stored="true"/>
现在我很困惑,因为从Nutch目录复制的schema.xml只有124行。哪里粘贴那条线?
谢谢!