我有一个用shell编写的框架,它调用多个hql文件。
hive -f file1.hql
hive -f file2.hql
hive -f file3.hql
每个hive -f命令创建新会话并花费大量时间来执行命令。很多时候,这些文件中的实际查询会很快运行,但大部分时间用于创建新会话。
Deoe hive支持会话轮询/或在hql文件中创建会话一次并在所有其他hive -f调用期间重用它的任何其他机制?
答案 0 :(得分:0)
据我所知,这是不可能的。最好你可以考虑将你的hql文件合并到一个批处理文件中。 作为替代和推荐的方法,您可以考虑切换到HiveServer2服务,例如在Python中使用https://github.com/cloudera/impyla。