这是我的数据框:
df = pd.DataFrame({'a':[100, 105, 110, 150, 160], 'b':[2,2,1,3,2], 'c':[200, 210, 110, 450, 300], 'x':[0,0,0,1,1]})
a b c x
0 100 2 200 0
1 105 2 210 0
2 110 1 110 0
3 150 3 450 1
4 160 2 300 1
我接下来添加此列:
df['csum'] = df.groupby('x')['c'].cumsum()
我想添加另一列,以显示最后0个csum
(即520)和最后一个csum
1个(即750)之间的差异(百分比)。在这种情况下,差异为44.23%。
我想要的结果看起来像这样:
a b c x csum result
0 100 2 200 0 200 44.23
1 105 2 210 0 410 44.23
2 110 1 110 0 520 44.23
3 150 3 450 1 450 44.23
4 160 2 300 1 750 44.23
答案 0 :(得分:1)
使用last
df['result']=df.groupby('x').csum.last().pct_change().iloc[-1]
df
Out[891]:
a b c x csum result
0 100 2 200 0 200 0.442308
1 105 2 210 0 410 0.442308
2 110 1 110 0 520 0.442308
3 150 3 450 1 450 0.442308
4 160 2 300 1 750 0.442308