熊猫数据框和重复的名称

时间:2018-11-03 13:05:53

标签: pandas duplicates pandas-groupby

我有一个Pandas数据框,以及一些有关某些人的数字数据。 我需要做的是找到在数据框中占比超过一次的人员,并用一行替换一个人的所有行,其中数值是之前各行的数值之和。

示例:

Names  Column1 Column1  
Jonh     1        2  
Bob      2        3  
Pier     1        1  
John     3        3  
Bob      1        0  

必须成为:

Names  Column1 Column1  
Jonh     4        5  
Bob      3        3  
Pier     1        1  

我该怎么办?

2 个答案:

答案 0 :(得分:0)

尝试一下:

In [975]: df.groupby('Names')[['Column1','Column2']].sum()
Out[975]: 
       Column1  Column2
Names                  
Bob          3        3
John         4        5
Pier         1        1

答案 1 :(得分:0)

groupbysum应该做好

df.groupby('Names').sum().sort_values('Column1', ascending=False)

       Column1  Column1.1
Names                    
Jonh         4          5
Bob          3          3
Pier         1          1