我有一个Pandas数据框,以及一些有关某些人的数字数据。 我需要做的是找到在数据框中占比超过一次的人员,并用一行替换一个人的所有行,其中数值是之前各行的数值之和。
示例:
Names Column1 Column1
Jonh 1 2
Bob 2 3
Pier 1 1
John 3 3
Bob 1 0
必须成为:
Names Column1 Column1
Jonh 4 5
Bob 3 3
Pier 1 1
我该怎么办?
答案 0 :(得分:0)
尝试一下:
In [975]: df.groupby('Names')[['Column1','Column2']].sum()
Out[975]:
Column1 Column2
Names
Bob 3 3
John 4 5
Pier 1 1
答案 1 :(得分:0)
groupby
和sum
应该做好
df.groupby('Names').sum().sort_values('Column1', ascending=False)
Column1 Column1.1
Names
Jonh 4 5
Bob 3 3
Pier 1 1