今天的累计计数(customer_id)和截至今天的日期,即Hive中的运行总和函数?

时间:2015-09-08 05:56:41

标签: sql hive

我是sql和hive的新手。有没有办法获得今天的日期累积计数(customer_id)以及截至今天的日期,即运行总和函数蜂巢?此格式的日期列:

20120907

我的数据集中有2列,customer_id和date。

我的表中还有分区,customer_id列中的一些值为NULL。我不确定是否有重复,所以我将使用

计数(不同(CUSTOMER_ID)) 以下是我的数据示例。

customer_id  date
10001         20140901
10003         20141001
NULL          20150101
10007         20150102

如果您需要更多信息,请告诉我。如果可以的话,请发布完整的查询。

1 个答案:

答案 0 :(得分:0)

SELECT SUM(CASE WHEN customer_id is null THEN 1 ELSE 0 END) + COUNT(DISTINCT(customer_id)) count_all FROM yourTable 
WHERE date <= GETDATE()

可能你正在寻找这个。