可以找到或加载主类org.apache.nutch.crawl.InjectorJob

时间:2015-03-09 09:27:08

标签: hadoop solr nutch

我正在使用Linux与Hadoop,Cloudera和HBase。

你能告诉我如何纠正这个错误吗?

错误:could to find or load main class org.apache.nutch.crawl.InjectorJob

以下命令给了我错误:

src/bin/nutch inject crawl/crawldb dmoz/

如果您需要任何其他信息请求我。

1 个答案:

答案 0 :(得分:1)

我想你可能错过了一两步。请确认:

  1. 您是否安装了Apache ANT,然后导航到nutch文件夹并输入“ant”?
  2. 您是否设置了环境变量:
    • NUTCH_JAVA_HOME:要使用的java实现。覆盖JAVA_HOME
    • NUTCH_HEAPSIZE:要使用的最大堆数,以MB为单位。默认值为1000。
    • NUTCH_OPTS:额外的Java运行时选项。多个选项必须用空格分隔。
    • NUTCH_LOG_DIR:日志目录(default: $NUTCH_HOME/logs)
    • NUTCH_LOGFILE:日志文件(default: hadoop.log)
    • NUTCH_CONF_DIR:配置文件(default: $NUTCH_HOME/conf)的路径。必须用冒号':'分隔多个路径。
    • JAVA_HOME
    • NUTCH_JAVA_HOME
    • NUTCH_HOME
  3. 如果您使用“ant”安装,那么您将在/nutch called /nutch/runtime/local中获得一个新文件夹,这是您必须实际运行nutch的地方。

    提示:请尝试阅读this page