我在一年内为许多用户提供了大量的金融交易数据集,我希望获取一部分数据,以便用户在一年中的每个月至少执行过1笔交易。
Date UserID
06/1/2012 20:35:59 1
08/1/2012 20:35:59 1
12/1/2012 20:35:59 1
12/2/2012 20:35:59 1
04/3/2012 20:35:59 1
09/4/2012 20:35:59 1
02/5/2012 20:35:59 1
04/5/2012 20:35:59 1
06/5/2012 20:35:59 1
14/6/2012 20:35:59 1
29/7/2012 20:35:59 1
03/8/2012 20:35:59 1
25/9/2012 20:35:59 1
08/10/2012 20:35:59 1
28/11/2012 20:35:59 1
27/12/2012 20:35:59 1
20/1/2012 20:35:59 2
09/2/2012 20:35:59 2
04/3/2012 20:35:59 2
因此,鉴于上述情况,输出应仅包含在一年中的每个月都有交易的用户1的交易,即
Date UserID
06/1/2012 20:35:59 1
08/1/2012 20:35:59 1
12/1/2012 20:35:59 1
12/2/2012 20:35:59 1
04/3/2012 20:35:59 1
09/4/2012 20:35:59 1
02/5/2012 20:35:59 1
04/5/2012 20:35:59 1
06/5/2012 20:35:59 1
14/6/2012 20:35:59 1
29/7/2012 20:35:59 1
03/8/2012 20:35:59 1
25/9/2012 20:35:59 1
08/10/2012 20:35:59 1
28/11/2012 20:35:59 1
27/12/2012 20:35:59 1
我的日期格式为'%Y-%m-%d %H:%M:%S.%f'
我正在使用熊猫。
更新:此外,我想在代码中加入一种方法,可以轻松更改用户子集,使子集包含在12个月中有11个进行交易的用户,或12个中的10个用户,等...
谢谢!