找到每天最常用的主题标签?

时间:2017-10-30 17:12:16

标签: sql hive hiveql

以下是我的配置单元的数据片段

2009-01-01 #aaa 2
2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1

表的描述是

id         bigint
hashtag    string
dt         date

该表基本上包含每天标签计数的信息。我想写一个hive查询,它将返回每天最常用的主题标签及其计数。例如,

2009-01-01 #bbb 3
2009-01-02 #ccc 1
2009-01-02 #ddd 1

任何人都可以帮我吗? 谢谢。

1 个答案:

答案 0 :(得分:1)

试试这个。

SELECT a.dt,
       a.hashtag,
       b.id
FROM mytable a
JOIN
  (SELECT dt,
          MAX(id) as id
   FROM mytable
   GROUP BY dt) b ON a.id = b.id
AND a.dt = b.dt
ORDER BY a.hashtag;