从oozie调用ImportTsv加载到hbase

时间:2016-06-22 05:48:51

标签: import hbase oozie

从oozie调用importtsv的最佳方法是什么。这就是我想通过oozie运行的内容:

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns="HBASE_ROW_KEY,cf:name" nameTab hdfs://xyz.com:8020/user/me/name.csv

我是否必须将其放在脚本中,如果是这样,如何调用hbase,以及要添加的库是什么。新手请帮帮忙。

1 个答案:

答案 0 :(得分:0)

Oozie没有直接使用hbase动作。我想,您可以使用shell操作,将此命令放入shell脚本。

重要的是,使用启动器映射程序作业执行shell操作,该作业可以在群集上的任何计算机上进行调度/启动。因此,必须在群集中的所有节点上安装hbase客户端。

您可以将Hbase相关的jar文件复制到HDFS中工作流程的lib目录中。

您可以添加以下罐子:(根据需要选中/选择版本)。

hbase-xxx.jar
hbase-procedure-1.1.2.jar
hbase-server-1.1.2.jar
hbase-common-1.1.2.jar
hbase-client-1.1.2.jar
hbase-protocol-1.1.2.jar