如何在Hive

时间:2015-12-20 12:57:08

标签: mapreduce hive

如何在Max函数的输出上使用Count函数。我有一个表candidates,其列为candidatenames,如下所示

AAA  
BBB
CCC
BBB
AAA
FFF
AAA
AAA

我想要输出如下:

AAA 4

由于AAA出现了最长时间4。如何在hive中获得此输出?

1 个答案:

答案 0 :(得分:0)

您可以使用Hive窗口函数执行此操作;你可以阅读他们here

<强>查询

select candidates, c
from (
    select candidates, c
        , max(c) over () max_c
    from (
        select candidates, count(*) c
        from db.table
        group by candidates ) x
    ) y
where max_c = c

<强>输出

candidates    c
AAA           4