我是sql和hive的新手。有没有办法获得今天的日期累积计数(customer_id)以及截至今天的日期,即运行总和函数蜂巢?此格式的日期列:
20120907
我的数据集中有2列,customer_id和date。
我的表中还有分区,customer_id列中的一些值为NULL。我不确定是否有重复,所以我将使用
计数(不同(CUSTOMER_ID)) 以下是我的数据示例。
customer_id date
10001 20140901
10003 20141001
NULL 20150101
10007 20150102
如果您需要更多信息,请告诉我。如果可以的话,请发布完整的查询。
答案 0 :(得分:0)
SELECT SUM(CASE WHEN customer_id is null THEN 1 ELSE 0 END) + COUNT(DISTINCT(customer_id)) count_all FROM yourTable
WHERE date <= GETDATE()
可能你正在寻找这个。