在Hive中汇总和比较列?

时间:2016-12-22 12:12:06

标签: hive hiveql

这可能只是因为我是蜂巢新手。我不知道如何在Hive中做到这一点?

我有一个样本数据集,如下所示:

    column_A       column_B    column_C
       1             1          0
       1             1          0
       1             0          1

现在,我需要找出每列的总和,然后比较它们以获得最高值。

例如:

 column_A       column_B    column_C
    3              2            1

输出应为:

  column_A   
     3  

我写的查询无法执行每列的总和并比较列以找到其中最大的列。

SELECT (sum(column_A) as A,sum(column_B) as B,sum(column_C) as C) as xyz
from table_name where A IN (SELECT GREATEST(A,B,C) from xyz) ;

1 个答案:

答案 0 :(得分:1)

您可以在聚合之后使用greatest()

SELECT greatest(sum(column_A), sum(column_B), sum(column_C)) 
from table_name;