我有一个拥有数百万条记录的hive表,每一行都是一个有日期的唯一记录 - 例如:
name, date, item
bob, jan 1, brush
jim, jan 1, computer
mary, jan 1, mouse
bill, jan 2, mop
james, jan 3, desk
我希望输出只显示每天有多少条记录。我试过了:
select distinct(date), count(distinct(date)) distinct for date
from DB
和
select distinct(date) from DB group by count(distinct(date))
我意识到我不能只计算(不同(日期))因为这只是给了我不同日期的总数。我希望输出为:
date, count
jan 1, 3
jan 2, 1
jan 3, 1
提前致谢,
答案 0 :(得分:2)
这是一个基本的group by
查询:
select date, count(*)
from DB
group by date;
我建议您花一点时间研究SQL查询的基础知识。有很多在线资源。