Nutch和Solr入门:哪里是Solr的conf /目录?

时间:2013-07-10 23:41:44

标签: solr nutch

我正在尝试使用Nutch(v 1.7)和Solr(v 4.3.1)。我正在学习本教程:http://wiki.apache.org/nutch/NutchTutorial

我对step 6感到困惑,我被告知要将Nutch模式文件复制到Solr的目录中。

  

6。 Solr与Nutch集成

     

我们已正确安装和设置Nutch和Solr。和Nutch   已经从种子URL创建了爬网数据。以下是步骤   将搜索委托给Solr以获取可搜索的链接:

     

cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml   $ {APACHE_SOLR_HOME} /示例/ solr的/ CONF /

问题是${APACHE_SOLR_HOME}/example/solr/conf/不存在。 /example/solr/仅包含

README.txt  
bin     
collection1 
solr.xml
zoo.cfg

有谁知道怎么办?我应该创建 ./example/solr/conf目录并将Nutch文件复制到该目录吗?

非常感谢你的帮助。

3 个答案:

答案 0 :(得分:5)

由于您使用的是Solr 4.x,因此您可以在collection1中使用conf,您应该可以执行以下操作:

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/collection1/conf/

答案 1 :(得分:1)

我认为我的错误是在这个特别的Nutch教程中使用了Solr的4.3.1版本。 Solr的早期版本(如3.6.2)有一个conf目录,教程表明应该这样做。我认为本教程是用v 3.6.2编写的。

我已切换到Solr v.3.6.2,现在情况更顺利。

答案 2 :(得分:1)

我正在尝试将Apache Nutch 1.7与Apache Solr 3.6.2集成,并且就在你提到的那一行之后就有了这一行:

Copy exactly in 351 line: 

<field name="_version_" type="long" indexed="true" stored="true"/>

现在我很困惑,因为从Nutch目录复制的schema.xml只有124行。哪里粘贴那条线?

谢谢!