您好我跟随this tutorial尝试在Eclipse中运行Nutch并逐步运行Nutch。
我完成了这一步(Nutch 1.X)没有问题:
svn co https://svn.apache.org/repos/asf/nutch/trunk
cd trunk
由于我正在处理1.X
,所以我跳到了第5步。但是,它提到:
Add “http.agent.name” and “http.robots.agents” with appropiate values in “conf/nutch-site.xml”. See conf/nutch-default.xml for the description of these properties. Also, add “plugin.folders” and set it to {PATH_TO_NUTCH_CHECKOUT}/build/plugins. eg. If Nutch is present at "/home/tejas/Desktop/2.x", set the property to:
<property>
<name>plugin.folders</name>
<value>/home/tejas/Desktop/2.x/build/plugins</value>
</property>
所以这是我的问题:
(1)。默认情况下,trunk/conf
文件夹中没有nutch-site.xml文件,但是,有一个nutch-site.xml.template文件,我将其重命名为nutch-site.xml以供使用。
(2)。 {PATH_TO_NUTCH_CHECKOUT}/build/plugins
,我真的不知道这个build
文件夹的位置。
这就是我所做的:
trunk$ find . | grep build
./.svn/prop-base/build.xml.svn-base
./.svn/text-base/build.xml.svn-base
./build.xml
./src/plugin/.svn/prop-base/build-plugin.xml.svn-base
./src/plugin/.svn/prop-base/build.xml.svn-base
...
显然,没有名为'build'的文件夹,也没有'plugins'。
那么我应该将./src/plugin
作为./build/plugins
文件夹继续进行吗?我没有那么多从源头构建的经验,所以任何建议都表示赞赏!
答案 0 :(得分:2)
以下是您的问题的答案:
1)是的。您是正确的,您必须将nutch-site.xml.template文件重命名为nutch-site.xml并相应地进行更改。
2)目前没有 / build / plugins 文件夹。但是当您运行“ant eclipse”命令时,您将在 {PATH_TO_NUTCH_CHECKOUT} 中获得“/ build / plugins” 这就是为什么它被写为绝对路径设置为 {PATH_TO_NUTCH_CHECKOUT} / build / plugins 不要在这里给出相对路径,因为它不会。
希望这可以帮助你!!!