如何使用Python Pandas基于日期对数据进行子集化?

时间:2014-10-10 17:29:33

标签: python pandas subset

我在一年内为许多用户提供了大量的金融交易数据集,我希望获取一部分数据,以便用户在一年中的每个月至少执行过1笔交易。

Date                   UserID
06/1/2012  20:35:59    1
08/1/2012  20:35:59    1
12/1/2012  20:35:59    1
12/2/2012  20:35:59    1
04/3/2012  20:35:59    1
09/4/2012  20:35:59    1
02/5/2012  20:35:59    1
04/5/2012  20:35:59    1
06/5/2012  20:35:59    1
14/6/2012  20:35:59    1
29/7/2012  20:35:59    1
03/8/2012  20:35:59    1
25/9/2012  20:35:59    1
08/10/2012 20:35:59    1
28/11/2012 20:35:59    1
27/12/2012 20:35:59    1
20/1/2012  20:35:59    2
09/2/2012  20:35:59    2
04/3/2012  20:35:59    2

因此,鉴于上述情况,输出应仅包含在一年中的每个月都有交易的用户1的交易,即

Date                   UserID
06/1/2012  20:35:59    1
08/1/2012  20:35:59    1
12/1/2012  20:35:59    1
12/2/2012  20:35:59    1
04/3/2012  20:35:59    1
09/4/2012  20:35:59    1
02/5/2012  20:35:59    1
04/5/2012  20:35:59    1
06/5/2012  20:35:59    1
14/6/2012  20:35:59    1
29/7/2012  20:35:59    1
03/8/2012  20:35:59    1
25/9/2012  20:35:59    1
08/10/2012 20:35:59    1
28/11/2012 20:35:59    1
27/12/2012 20:35:59    1

我的日期格式为'%Y-%m-%d %H:%M:%S.%f' 我正在使用熊猫。

更新:此外,我想在代码中加入一种方法,可以轻松更改用户子集,使子集包含在12个月中有11个进行交易的用户,或12个中的10个用户,等...

谢谢!

0 个答案:

没有答案