从oozie调用importtsv的最佳方法是什么。这就是我想通过oozie运行的内容:
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns="HBASE_ROW_KEY,cf:name" nameTab hdfs://xyz.com:8020/user/me/name.csv
我是否必须将其放在脚本中,如果是这样,如何调用hbase,以及要添加的库是什么。新手请帮帮忙。
答案 0 :(得分:0)
Oozie没有直接使用hbase
动作。我想,您可以使用shell
操作,将此命令放入shell脚本。
重要的是,使用启动器映射程序作业执行shell
操作,该作业可以在群集上的任何计算机上进行调度/启动。因此,必须在群集中的所有节点上安装hbase客户端。
您可以将Hbase相关的jar文件复制到HDFS中工作流程的lib
目录中。
您可以添加以下罐子:(根据需要选中/选择版本)。
hbase-xxx.jar
hbase-procedure-1.1.2.jar
hbase-server-1.1.2.jar
hbase-common-1.1.2.jar
hbase-client-1.1.2.jar
hbase-protocol-1.1.2.jar