有没有办法用不同的配置文件运行NUTCH?

时间:2012-03-12 19:12:43

标签: solr lucene nutch

我想知道是否可以使用不同的配置文件集运行相同的NUTCH实例?我无法在参数列表中看到任何选项以允许这样的事情。

我想只在一台计算机上运行NUTCH而且我不想复制nutch实例。

有没有人知道这样做的简单方法,还是我需要自己修改bin / nutch脚本来完成它。

感谢。

2 个答案:

答案 0 :(得分:3)

This nutch FAQ应该有用。答案描述了如何创建自定义conf目录,并让nutch通过$NUTCH_CONF_DIR环境变量指向它。

答案 1 :(得分:0)

您可以使用Unix符号链接并在脚本中更改此链接。比如,如果你有regex-urlfilter-conf_A.txt和regex-urlfilter-conf_B.txt。在您的脚本中,在启动nutch之前:

对于conf A:

ln -sf $NUTCH_FOLDER/conf/regex-urlfilter-conf_A.txt $NUTCH_FOLDER/conf/regex-urlfilter.txt

对于conf B:

ln -sf $NUTCH_FOLDER/conf/regex-urlfilter-conf_B.txt $NUTCH_FOLDER/conf/regex-urlfilter.txt