通常Hive查询需要一些时间来执行,这可能只需几分钟到几小时。如果数百个Java客户端正在执行Hive查询,则可能此类客户端将等待很长时间才能获得结果,并且可能由于网络问题而超时。是否有可以使用Hive的异步功能而不是同步行为?
缓解此类问题的最佳做法是什么?
答案 0 :(得分:1)
Hadoop作业调度程序为生产作业提供有保证的容量,并为交互式作业提供良好的响应时间,同时在用户之间公平分配资源。您可以查看以下博客。
http://blog.cloudera.com/blog/2008/11/job-scheduling-in-hadoop/
Hive没有异步功能