以下是我的配置单元的数据片段
2009-01-01 #aaa 2
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1
表的描述是
id bigint
hashtag string
dt date
该表基本上包含每天标签计数的信息。我想写一个hive查询,它将返回每天最常用的主题标签及其计数。例如,
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1
任何人都可以帮我吗? 谢谢。
答案 0 :(得分:1)
试试这个。
SELECT a.dt,
a.hashtag,
b.id
FROM mytable a
JOIN
(SELECT dt,
MAX(id) as id
FROM mytable
GROUP BY dt) b ON a.id = b.id
AND a.dt = b.dt
ORDER BY a.hashtag;