运行Hive查询的最佳实践是什么?

时间:2013-11-20 20:45:20

标签: hive datastax-enterprise

通常Hive查询需要一些时间来执行,这可能只需几分钟到几小时。如果数百个Java客户端正在执行Hive查询,则可能此类客户端将等待很长时间才能获得结果,并且可能由于网络问题而超时。是否有可以使用Hive的异步功能而不是同步行为?

缓解此类问题的最佳做法是什么?

1 个答案:

答案 0 :(得分:1)

Hadoop作业调度程序为生产作业提供有保证的容量,并为交互式作业提供良好的响应时间,同时在用户之间公平分配资源。您可以查看以下博客。

http://blog.cloudera.com/blog/2008/11/job-scheduling-in-hadoop/

Hive没有异步功能