我正在尝试在服务器上运行hadoop作业。版本为0.20.2
。
我有大量的罐子,我正在运行:
hadoop jar GenData.jar -libjars /path/jar1,path/jar2,...
即使相应的类在jar中,我也会收到以下错误:
线程中的异常" main" java.lang.NoClassDefFoundError: org / apache / avro / mapreduce / AvroKeyInputFormat at GenerateTrainningData.main(GenerateTrainningData.java:256)at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) 在 sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 在java.lang.reflect.Method.invoke(Method.java:606)at org.apache.hadoop.util.RunJar.main(RunJar.java:197)引起: 抛出java.lang.ClassNotFoundException: org.apache.avro.mapreduce.AvroKeyInputFormat at java.net.URLClassLoader $ 1.run(URLClassLoader.java:366)at java.net.URLClassLoader $ 1.run(URLClassLoader.java:355)at java.security.AccessController.doPrivileged(Native Method)at java.net.URLClassLoader.findClass(URLClassLoader.java:354)at java.lang.ClassLoader.loadClass(ClassLoader.java:425)at java.lang.ClassLoader.loadClass(ClassLoader.java:358)
答案 0 :(得分:1)
看起来你从Hadoop客户端获得此异常,Mapreduce驱动程序代码执行发生在Client JVM中。在hadoop -libjars中是一个通用选项,用于向mapper / reducer添加依赖jar。在您将Jars添加到客户端集的情况下,您可以在执行hadoop命令之前设置以下环境变量。
export HADOOP_CLASSPATH=<PATH_to_jar>/Jar1:<PATH_to_jar>/Jar2;
(冒号&#34;:&#34;可用于指定多个1个罐子,在您的情况下,您可以添加包含类org.apache.avro.mapreduce.AvroKeyInputFormat
的Jar)。
新修改
首先,您需要找到包含类org.apache.avro.mapreduce.AvroKeyInputFormat
的jar。您可以使用上面的命令在jar avro-mapred*.jar
中找到该类(从互联网获取avro-mapred-version.jar
的兼容版本),在类路径中包含相同的内容。
答案 1 :(得分:0)
您缺少avro-mapred
依赖项。