Question

我正在使用CLoudera Hadoop 4.8，我有一个包含4个节点的集群。问题是：如果我用Hue启动Hive查询，则需要5个小时才能完成。查询是：

select count(*) from table_name

此时Nodes loadavg

Node1 40 -- strongest node
Node2 20 
Node3 20
Node4 20

但是，如果我从蜂巢控制台启动相同的查询，则需要约30分钟才能结束。并且loadavg更低！

Node1 12 -- strongest node
Node2 6 
Node3 6
Node4 6

为什么会这样？

系统：

OS: CentOS 6.5
Cloudera 4.8

Answer 1

是哪个Hue版本？

Hue将Hive查询提交给将运行它的Beeswax Server或HiveServer2（与从shell执行它相同）。您是否在Beeswax或Hue日志（Hue中的页面/日志）中看到任何表明存在错误配置的内容。您还可以从Hue节点（其中有Beeswax或HiveServer2）执行查询，以确保它们都使用相同的配置。

顺化工作很慢

1 个答案: