尝试运行一个从RCFile读取数据的简单mapreduce代码。
我使用hadoop命令运行代码:
hadoop jar MRJobRCFile.jar MRJobRCFile <inputRCfile> <outputfile>
尽管将hive-exec jar添加到hadoop类路径,但是会出现此错误。
export HADOOP_CLASSPATH=/opt/cmr/hadoopinstall/hive-0.10.0-cdh4.4.0/lib/hive-exec-0.10.0-cdh4.4.0.jar
我怎么能添加jar?
尝试使用verbose:class:
检查jvm中加载的jar[从文件中加载org.apache.hadoop.hive.ql.io.RCFileInputFormat:/opt/cmr/hadoopinstall/hive-0.10.0-cdh4.4.0/lib/hive-exec-0.10.0-cdh4。 4.0.jar]
JVM正在加载RCFileInputFormat。
知道如何处理这个问题吗?错误:
java.lang.RuntimeException: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.hive.ql.io.RCFileInputFormat not found
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1649)
at org.apache.hadoop.mapred.JobConf.getInputFormat(JobConf.java:620)
at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:394)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:332)
at org.apache.hadoop.mapred.Child$4.run(Child.java:268)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1408)
at org.apache.hadoop.mapred.Child.main(Child.java:262)
Caused by: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.hive.ql.io.RCFileInputFormat not found
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1617)
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java
答案 0 :(得分:0)
通过将hive-exec jar添加到HADOOP_CLASSPATH和分布式缓存中解决。
将jar添加到分布式缓存是为了使它们可用于远程映射并减少任务JVM。在HADOOP_CLASSPATH中添加的是客户端JVM(由hadoop jar命令创建)。