我有一个数据集,我需要按小时进行分组,并创建一个额外的计数列,以计算该小时中发生的行数。
数据集的样本如下所示:
UserId Date Year Month Day Hour Method
1 2016-04-1 2016 04 1 10 Cash
1 2016-04-1 2016 04 1 10 Visa
2 2016-04-1 2016 04 1 10 Cash
4 2016-04-1 2016 04 1 11 Cash
3 2016-04-1 2016 04 1 12 Cash
5 2016-04-1 2016 04 1 12 Cash
5 2016-04-2 2016 04 2 11 Cash
6 2016-04-2 2016 04 2 11 Cash
1 2016-04-2 2016 04 2 12 Cash
1 2016-04-5 2016 04 5 14 Cash
6 2016-04-5 2016 04 5 14 Cash
以此类推。
所以基本上,我希望最终的数据集具有列daty,月,年,并按小时分组以表示计数,如下所示:
Date Year Month Day Hour Count
2016-04-1 2016 04 1 10 3
2016-04-1 2016 04 1 11 1
2016-04-1 2016 04 1 12 2
2016-04-2 2016 04 2 11 2
2016-04-2 2016 04 2 12 1
2016-04-5 2016 04 5 14 2