如何自动化Hive查询

时间:2015-04-17 13:06:16

标签: mysql hadoop hive apache-pig

我创建了一个hive查询脚本,主要用于交叉销售项目的功能创建和评分。大多数查询是执行数据清理,转换等的简单查询。我想自动执行此过程,以便我可以从hive表作为输入开始,并可以将最终结果输出到Hbase文件中。我的问题是:

最好的方法是什么?

我可以简单地创建filename.sqlfilename.hql并使用hive -f filename.sql

从shell运行它

像PL for SQL这样的hive有什么东西吗?

2 个答案:

答案 0 :(得分:2)

您可以通过多种方式完成此操作。 就像你也可以使用Hive CLI,它很容易做这样的工作。 您可以在Linux中编写shell脚本,在Windows中编写.bat。

在脚本中,您可以简单地查看以下条目。

$HIVE_HOME/bin/hive -e 'select a.col from tab1 a';

或者如果你有文件:

$HIVE_HOME/bin/hive -f /home/my/hive-script.sql

确保在你的环境中设置了$ HIVE_HOME。 一旦你测试并正常工作,你可以输入cronjob进行安排。

答案 1 :(得分:0)

重要的是要注意,如果您使用任何一种技术,您的每个查询必须用分号分隔,即

hive -e 'select * from tableA limit 10;select * from tableB limit 10'