Hive - 计算数据库中每天的记录数

时间:2018-01-23 02:59:34

标签: sql hadoop hive hiveql

我有一个拥有数百万条记录的hive表,每一行都是一个有日期的唯一记录 - 例如:

name, date, item
bob, jan 1, brush
jim, jan 1, computer
mary, jan 1, mouse
bill, jan 2, mop
james, jan 3, desk

我希望输出只显示每天有多少条记录。我试过了:

select distinct(date), count(distinct(date)) distinct for date
from DB

select distinct(date) from DB group by count(distinct(date))

我意识到我不能只计算(不同(日期))因为这只是给了我不同日期的总数。我希望输出为:

date, count
jan 1, 3
jan 2, 1
jan 3, 1

提前致谢,

1 个答案:

答案 0 :(得分:2)

这是一个基本的group by查询:

select date, count(*)
from DB
group by date;

我建议您花一点时间研究SQL查询的基础知识。有很多在线资源。