pandas总结每组中两列之间的差异

时间:2018-03-16 16:00:15

标签: python python-3.x pandas dataframe pandas-groupby

我看起来像A B C D 2017-10-01 2017-10-11 M 2017-10 2017-10-02 2017-10-03 M 2017-10 2017-11-01 2017-11-04 B 2017-11 2017-11-08 2017-11-09 B 2017-11 2018-01-01 2018-01-03 A 2018-01

dtype

A的{​​{1}}和B datetime64CD属于strings;

我喜欢groupby CD并获得BA之间的差异,

df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A'])

但我不知道如何在每个组中总结这些差异并将值分配给新列E,可能在新的df

C    D          E
M    2017-10    11
M    2017-10    11
B    2017-11    4
B    2017-11    4
A    2018-01    2

1 个答案:

答案 0 :(得分:1)

基于您的代码

df.merge(df.groupby(['C', 'D']).apply(lambda row: row['B'] - row['A']).sum(level=[0,1]).reset_index())
Out[292]: 
           A          B  C        D       0
0 2017-10-01 2017-10-11  M  2017-10 11 days
1 2017-10-02 2017-10-03  M  2017-10 11 days
2 2017-11-01 2017-11-04  B  2017-11  4 days
3 2017-11-08 2017-11-09  B  2017-11  4 days
4 2018-01-01 2018-01-03  A  2018-01  2 days