我有一个由于连接而产生的df:
ID count
0 A 30
1 A 30
2 B 5
3 C 44
4 C 44
5 C 44
我希望能够基于ID列迭代count列。这是预期结果的示例:
ID count
0 A 30
1 A 31
2 B 5
3 C 44
4 C 45
5 C 46
我知道有一些非Python的方法可以通过循环来执行此操作,但是我想知道是否存在一种更智能的方法(并且省时,因为此表很大)。
答案 0 :(得分:3)
转换组以获取累积计数并将其添加到计数,例如:
df['count'] += df.groupby('ID')['count'].cumcount()
给你:
ID count
0 A 30
1 A 31
2 B 5
3 C 44
4 C 45
5 C 46