我正在使用CLoudera Hadoop 4.8,我有一个包含4个节点的集群。 问题是:如果我用Hue启动Hive查询,则需要5个小时才能完成。 查询是:
select count(*) from table_name
此时Nodes loadavg
Node1 40 -- strongest node
Node2 20
Node3 20
Node4 20
但是,如果我从蜂巢控制台启动相同的查询,则需要约30分钟才能结束。并且loadavg更低!
Node1 12 -- strongest node
Node2 6
Node3 6
Node4 6
为什么会这样?
系统:
OS: CentOS 6.5
Cloudera 4.8
答案 0 :(得分:0)
是哪个Hue版本?
Hue将Hive查询提交给将运行它的Beeswax Server或HiveServer2(与从shell执行它相同)。您是否在Beeswax或Hue日志(Hue中的页面/日志)中看到任何表明存在错误配置的内容。您还可以从Hue节点(其中有Beeswax或HiveServer2)执行查询,以确保它们都使用相同的配置。