对大熊猫数据框的重复行求和

时间:2020-04-06 07:56:12

标签: python pandas dataframe

我有一个这样的数据框,

df
col1    col2     col3
 A       X         6
 B       Y         9
 C       Z         10
 B       Y         11
 F       P         7
 G       H         8
 D       Y         4
 G       H         4

现在,如果col1和col2值重复,我想添加行的col3值。例如,

B-Y-9和B-Y-11是重复的。所以这两行将变成单行B-Y-20

所以最终的数据帧应该看起来像

col1    col2     col3
 A       X         6
 C       Z         10
 B       Y         20
 F       P         7
 D       Y         4
 G       H         12

我可以使用for循环并将行与先前的行进行比较。但是执行时间会更多,需要寻找一些熊猫捷径/ pythonic方式来高效地执行。

1 个答案:

答案 0 :(得分:1)

df.groupby(['col1', 'col2']).sum().reset_index()