HBase completebulkload返回异常

时间:2012-07-27 17:12:05

标签: hadoop mapreduce hbase guava

我正在尝试使用Hadoop文档中的批量加载方法described从文本文件(几GB)快速批量填充HBase表。

我创建了一个HFile,我现在想把它推到我的HBase表中。

当我使用此命令时:

hadoop jar /home/hxcaine/hadoop/lib/hbase.jar completebulkload /user/hxcaine/dbpopulate/output/cf1 my_hbase_table

作业开始然后我得到这个例外:

Exception in thread "main" java.lang.NoClassDefFoundError: com/google/common/util/concurrent/ThreadFactoryBuilder
        at org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles.doBulkLoad(LoadIncrementalHFiles.java:195)
        at org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles.run(LoadIncrementalHFiles.java:696)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
        at org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles.main(LoadIncrementalHFiles.java:701)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
        at java.lang.reflect.Method.invoke(Method.java:597)
        at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:68)
        at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:139)
        at org.apache.hadoop.hbase.mapreduce.Driver.main(Driver.java:49)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
        at java.lang.reflect.Method.invoke(Method.java:597)
        at org.apache.hadoop.util.RunJar.main(RunJar.java:197)
Caused by: java.lang.ClassNotFoundException: com.google.common.util.concurrent.ThreadFactoryBuilder
        at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
        at java.security.AccessController.doPrivileged(Native Method)
        at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
        at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
        ... 17 more

但是,我可以看到Guava jar在我的类路径中,当我在jar中检查时,我可以看到ThreadFactoryBuilder.class

我正在使用这些版本(并坚持使用它们):

  • Hadoop 0.20.2-cdh3u3
  • HBase 0.90.4-cdh3u3
  • 番石榴罐子:/usr/lib/hadoop-0.20/lib/guava-r09-jarjar.jar

我的类路径中有一个较旧的番石榴罐,但我不知道它来自哪里,我认为它不会产生影响。

有什么想法吗?

1 个答案:

答案 0 :(得分:4)

如果您运行会发生什么:

export HADOOP_CLASSPATH=`hbase classpath`

在运行负载之前?从堆栈跟踪看,它看起来像其中一个实际任务需要jar,虽然我很惊讶地看到这实际上开始了M / R工作。