说我有一个数据框,如下所示,它代表订阅了特定服务的帐户,订阅开始的日期和订阅结束的日期(如果尚未结束,则为null)。
ACCOUNT_ID START_DATE END_DATE
1 2018-05-01 2018-09-07
2 2018-07-20 2018-08-10
3 2018-06-10 null
我的目标是生成一个下表,该表具有每月该月第一天订阅该服务的人数。
DATE SUBSCRIBER_COUNT
2018-01-01 0
2018-02-01 0
2018-03-01 0
2018-04-01 0
2018-05-01 1
2018-06-01 2
2018-07-01 3
2018-08-01 3
2018-09-01 2
2018-10-01 1
2018-11-01 1
我尝试过的方法:
subscribed_yyyymmdd
,将每个布尔列添加到名为start < day && day < end
的原始数据帧中。然后boolcount这些列以获取订阅者计数。