比较数据帧的不同行号处的不同列值

时间:2016-07-08 01:21:40

标签: python pandas

我仍然是蟒蛇和熊猫的新手,还在努力学习。尝试将Pandas用于复杂场景。下面是我的数据框的一小部分样本

  In [9]: df
Out[9]:
       TXN_KEY Send_Agent  Pay_Agent        Send_Customer   /
0     13272184  AWD120279  AEU002152  1000000000021979638
1     13272947  ARA030122  AWD120279  1000000000030604143
2     13273453  API185805  API190139  2000000000096483346
3     13273870  ANO080012  API352676  1000000000046574257
4     13274676  AUK359401  API185805  1000000000082052557
5     13274871  ACL000105  ACB020203  1000000000082187111


   Pay_Customer           Send_Time            Pay_Time
0     1000000000081805876 2012-05-22 09:45:00 2012-05-31 02:50:00
1     1000000000021979638 2012-05-31 08:09:00 2012-05-31 09:52:00
2     2000000000241863019 2012-05-30 04:18:00 2012-05-30 23:42:00
3     2000000000080690692 2012-05-31 02:25:00 2012-05-31 21:43:00
4     2000000000096483346 2012-05-31 11:25:00 2012-05-31 11:57:00
5     1000000000301277732 2012-05-31 13:07:00 2012-05-31 17:36:00

Send_Customer使用发送代理向Pay_Agent汇款,Pay_Customer正在收款。

任何代理都可以是发送代理和付费代理。

对于所有代理商,我想要计算那些在10小时内汇款并收到货款的客户。

例如在上面的例子中:  客户1000000000021979638使用代理商AWD120279汇款,并在10小时内在同一代理商AWD120279处收款。

代理商API185805的客户2000000000096483346也是如此。

因此,这种情况下AWD120279和API185805的计数均为1。

我无法理解如何处理这种情况。提前谢谢。

1 个答案:

答案 0 :(得分:0)

从发送方和支付方分割数据帧并执行内连接为我提供了所需的输出。