Question

我有一个Pandas数据框，以及一些有关某些人的数字数据。我需要做的是找到在数据框中占比超过一次的人员，并用一行替换一个人的所有行，其中数值是之前各行的数值之和。

示例：

Names  Column1 Column1  
Jonh     1        2  
Bob      2        3  
Pier     1        1  
John     3        3  
Bob      1        0

必须成为：

Names  Column1 Column1  
Jonh     4        5  
Bob      3        3  
Pier     1        1

我该怎么办？

Answer 1

尝试一下：

In [975]: df.groupby('Names')[['Column1','Column2']].sum()
Out[975]: 
       Column1  Column2
Names                  
Bob          3        3
John         4        5
Pier         1        1

Answer 2

groupby和sum应该做好

df.groupby('Names').sum().sort_values('Column1', ascending=False)

       Column1  Column1.1
Names                    
Jonh         4          5
Bob          3          3
Pier         1          1

熊猫数据框和重复的名称

2 个答案: