将Hbase与Hive集成:注册Hbase表

时间:2014-03-27 13:08:38

标签: hadoop hive hbase apache-zookeeper hortonworks-data-platform

我使用的是Hortonworks Sandbox 2.0,其中包含以下版本的Hbase和Hive

Component       Version
------------------------
Apache Hadoop     2.2.0
Apache Hive      0.12.0
Apache HBase     0.96.0
Apache ZooKeeper  3.4.5

...和 我正在尝试使用以下查询将hbase表注册到配置单元

CREATE TABLE IF NOT EXISTS Document_Table_Hive (key STRING, author STRING, category STRING) STORED BY ‘org.apache.hadoop.hive.hbase.HBaseStorageHandler’ WITH SERDEPROPERTIES (‘hbase.columns.mapping’ = ‘:key,metadata:author,categories:category’) TBLPROPERTIES (‘hbase.table.name’ = ‘Document’);

这不起作用,我得到以下例外:

2014-03-26 09:14:57,341 ERROR exec.DDLTask (DDLTask.java:execute(435)) – java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration
at org.apache.hadoop.hive.hbase.HBaseStorageHandler.setConf(HBaseStorageHandler.java:249)
at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:73)
at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:133)

2014-03-26 09:14:57,368 ERROR ql.Driver (SessionState.java:printError(419)) – FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org/apache/hadoop/hbase/HBaseConfiguration

我已经创建了Hbase表“Document”,而describe命令给出了以下描述

‘Document’,
{NAME => ‘categories’,..},
{NAME => ‘comments’,..},
{NAME => ‘metadata’,..}

我尝试过以下事情

  1. 在hive-site.xml中添加hive.aux.jars.path

    hive.aux.jars.path
    file:///etc/hbase/conf/hbase-site.xml,file:///usr/lib/hbase/lib/hbase-common-0.96.0.2.0.6.0-76-hadoop2.jar,file:///usr/lib/hive/lib/hive-hbase-handler-0.12.0.2.0.6.0-76.jar,file:///usr/lib/hbase/lib/hbase-client-0.96.0.2.0.6.0-76-hadoop2.jar,file:///usr/lib/zookeeper/zookeeper-3.4.5.2.0.6.0-76.jar
    
  2. 使用hive add jar命令添加jar

    add jar /usr/lib/hbase/lib/hbase-common-0.96.0.2.0.6.0-76-hadoop2.jar;
    add jar /usr/lib/hive/lib/hive-hbase-handler-0.12.0.2.0.6.0-76.jar;
    add jar /usr/lib/hbase/lib/hbase-client-0.96.0.2.0.6.0-76-hadoop2.jar;
    add jar /usr/lib/zookeeper/zookeeper-3.4.5.2.0.6.0-76.jar;
    add file /etc/hbase/conf/hbase-site.xml
    
  3. 指定hadoop_classpath

    export HADOOP_CLASSPATH=/etc/hbase/conf:/usr/lib/hbase/lib/hbase-common-0.96.0.2.0.6.0-76-hadoop2:/usr/lib/zookeeper/zookeeper-3.4.5.2.0.6.0-76.jar
    
  4. 它仍然无效!

    如何在hive类路径中添加jar,以便找到hbaseConfiguration类, 或者这是一个完全不同的问题?

1 个答案:

答案 0 :(得分:2)

无需复制整个罐子。只需hbase-*.jar , zookeeper*.jar, hive-hbase-handler*.jar即可。默认情况下,所有与hadoop相关的jar都会被添加到hadoop类路径中,因为hive内部使用hadoop命令来执行。

通过将HIVE_AUX_JARS_PATH环境变量指定为/ usr / lib / hbase / lib / in /etc/hive/conf/hive-env.sh,也可以将hbase jar复制到hive库。

第二种方法比第一种方法更有建议