如何在Max
函数的输出上使用Count
函数。我有一个表candidates
,其列为candidatenames
,如下所示
AAA
BBB
CCC
BBB
AAA
FFF
AAA
AAA
我想要输出如下:
AAA 4
由于AAA
出现了最长时间4
。如何在hive中获得此输出?
答案 0 :(得分:0)
您可以使用Hive窗口函数执行此操作;你可以阅读他们here。
<强>查询强>:
select candidates, c
from (
select candidates, c
, max(c) over () max_c
from (
select candidates, count(*) c
from db.table
group by candidates ) x
) y
where max_c = c
<强>输出强>:
candidates c
AAA 4