在Apache Hive限制中需要备用查询

时间:2015-12-01 13:45:46

标签: hadoop hive apache-hive

我需要针对以下查询的替代查询。

从中选择a.name,max(a.cnt) (按名称从候选组中选择名称,计数(名称)作为cnt)a 由a.name命令分组2个desc limit 1;

如果存在候选人则删除表;

创建外部候选表(名称字符串) 存储为文本文件 LOCATION' / user / cloudera / test / Exercise / candidate'

在路径' / user / cloudera / test / candidate'中加载数据覆盖表候选者;

示例数据:

拉​​加

拉​​加

拉​​加

拉​​加

拉​​加

阿尼尔

阿尼尔

阿尼尔

阿尼尔

阿尼尔

阿尼尔

阿尼尔

吉瑞

吉瑞

吉瑞

马埃

马埃

我需要更多时间重复名称的结果。 如上例所示

Anil重复了一遍。

为了达到结果,我写了下面的查询。但是我对这个查询性能不满意有没有人有这个查询的替代方案?

从中选择a.name,max(a.cnt) (按名称从候选组中选择名称,计数(名称)作为cnt)a 由a.name命令分组2个desc limit 1;

由于 Venkadesan

1 个答案:

答案 0 :(得分:0)

output[j-1] = 0

是否在一个查询中运行得更快。