我仍然是蟒蛇和熊猫的新手,还在努力学习。尝试将Pandas用于复杂场景。下面是我的数据框的一小部分样本
In [9]: df
Out[9]:
TXN_KEY Send_Agent Pay_Agent Send_Customer /
0 13272184 AWD120279 AEU002152 1000000000021979638
1 13272947 ARA030122 AWD120279 1000000000030604143
2 13273453 API185805 API190139 2000000000096483346
3 13273870 ANO080012 API352676 1000000000046574257
4 13274676 AUK359401 API185805 1000000000082052557
5 13274871 ACL000105 ACB020203 1000000000082187111
Pay_Customer Send_Time Pay_Time
0 1000000000081805876 2012-05-22 09:45:00 2012-05-31 02:50:00
1 1000000000021979638 2012-05-31 08:09:00 2012-05-31 09:52:00
2 2000000000241863019 2012-05-30 04:18:00 2012-05-30 23:42:00
3 2000000000080690692 2012-05-31 02:25:00 2012-05-31 21:43:00
4 2000000000096483346 2012-05-31 11:25:00 2012-05-31 11:57:00
5 1000000000301277732 2012-05-31 13:07:00 2012-05-31 17:36:00
Send_Customer使用发送代理向Pay_Agent汇款,Pay_Customer正在收款。
任何代理都可以是发送代理和付费代理。
对于所有代理商,我想要计算那些在10小时内汇款并收到货款的客户。
例如在上面的例子中: 客户1000000000021979638使用代理商AWD120279汇款,并在10小时内在同一代理商AWD120279处收款。
代理商API185805的客户2000000000096483346也是如此。
因此,这种情况下AWD120279和API185805的计数均为1。
我无法理解如何处理这种情况。提前谢谢。
答案 0 :(得分:0)
从发送方和支付方分割数据帧并执行内连接为我提供了所需的输出。