减少许多配置单元调用的配置单元启动时间

时间:2014-03-03 23:32:03

标签: hadoop amazon-web-services hive amazon-emr emr

我正在以这种方式从命令行调用hive -e数百次:

cat hive_script.hql | parallel --gnu hive -e '{}' 

hive_script.hql中的每一行都可以独立运行并以任何顺序运行。

是否有任何--hiveconf参数可以减少启动时间? Apache网页似乎暗示可能存在

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VariableSubstitution

"This is frustrating as Hive becomes closely coupled with scripting languages. The Hive startup time of a couple seconds is non-trivial when doing thousands of manipulations such as multiple hive -e invocations."

1 个答案:

答案 0 :(得分:0)

你不能加速hive -e,但你可以在一个脚本中放置多个查询。

如果这不起作用,您将需要查看HiveServer2并从JDBC客户端调用查询。