REF FROM_DATE EXEMPT_FROM
10001033 2017-07-11 00:00:00 2017-07-11 00:00:00
10001033 2017-07-11 00:00:00 2017-08-10 00:00:00
10001033 2017-07-11 00:00:00 2018-04-01 00:00:00
10001769 2018-05-15 00:00:00 2016-07-15 00:00:00
10001769 2018-05-15 00:00:00 2018-01-03 00:00:00
10001769 2018-05-15 00:00:00 2018-05-15 00:00:00
10001769 2018-05-15 00:00:00 2018-06-14 00:00:00
我具有上述数据框,我希望能够计算出第一行From_DATE与第一行Exempt_FROM不匹配的唯一REF的数量。
例如,第一个REF号10001033 FROM_DATE和EXEMPT_FROM匹配,但是第二个REF 10001769不匹配。最好的方法是什么?
答案 0 :(得分:0)
IIUC,这就是你想要的
A = df.groupby('REF').first()
A.FROM_DATE == A.EXEMPT_FROM
输出:
REF
10001033 True
10001769 False
如果您想知道所需的匹配次数,请套用sum
sum(A.FROM_DATE == A.EXEMPT_FROM)