Hadoop运行时错误

时间:2012-07-11 17:02:03

标签: hadoop amazon-emr

我有学校项目与hadoop一起工作,并将在亚马逊EMR中托管。

首先,我试图通过简单的wordcount程序来理解它在eclipse IDE中运行良好。

但如果我试图从命令行运行,我就会遇到错误。

线程“main”中的异常java.lang.NoClassDefFoundError:org / apache / hadoop / conf / Configuration at counter.WordCount.main(WordCount.java:56) 引起:java.lang.ClassNotFoundException:org.apache.hadoop.conf.Configuration 在java.net.URLClassLoader $ 1.run(URLClassLoader.java:202) at java.security.AccessController.doPrivileged(Native Method)。

您是否对此错误以及任何理解hadoop和EMR的资源有任何建议?

谢谢, 妙

1 个答案:

答案 0 :(得分:0)

不要从IDE或使用java命令运行您的作业。而是在hadoop安装的bin /目录中使用hadoop脚本。

示例:如果您的Job的起点位于mrjob.MyJob类中并且您有一个包含Job类的jar(job.jar),则应该像这样运行它:

path/to/bin/hadoop jar job.jar mrjob.MyJob inputFolder outputFolder