Apache Nutch命令无法执行

时间:2013-05-13 12:01:59

标签: apache nutch

我遵循了Apache Nutch Wiki中的每一步。我正在使用MacOSX 10.8.3,我的JAVA_HOME已完美设置,甚至可以在执行bin/nutch时看到各种命令选项(根据维基)。

但是当我使用bin/nutch crawl urls -dir crawl -depth 3 -topN 5时,我收到以下错误:

bin/nutch: line 104: [: too many arguments
Error: Could not find or load main class Engines

仅供参考:我已在urls

中创建了apache-nutch-1.6/urls目录

任何人都能说出可能出现的问题吗?

2 个答案:

答案 0 :(得分:0)

你可以尝试如下:

首先,通过蚂蚁建立nutch。

cd nutch-1.x.x/runtime/local/

mkdir urls(对于种子列表目录)

mkdir crawl(适用于-dir选项)

vim urls/seed,然后添加一个或多个网址(例如:http://www.examplesite.com

bin/nutch crawl urls - 或 - bin/nutch crawl urls -dir crawl -depth 3 -topN 5

答案 1 :(得分:0)

经过一番研究后我发现我忘了设置NUTCH_JAVA_HOME。 这是一步:

set NUTCH_JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home
export NUTCH_JAVA_HOME

是的,我也重置了JAVA_HOME:

set JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home
export JAVA_HOME