Question

我有一个这样的数据框，

df
col1    col2     col3
 A       X         6
 B       Y         9
 C       Z         10
 B       Y         11
 F       P         7
 G       H         8
 D       Y         4
 G       H         4

现在，如果col1和col2值重复，我想添加行的col3值。例如，

B-Y-9和B-Y-11是重复的。所以这两行将变成单行B-Y-20

所以最终的数据帧应该看起来像

col1    col2     col3
 A       X         6
 C       Z         10
 B       Y         20
 F       P         7
 D       Y         4
 G       H         12

我可以使用for循环并将行与先前的行进行比较。但是执行时间会更多，需要寻找一些熊猫捷径/ pythonic方式来高效地执行。

Answer 1

df.groupby(['col1', 'col2']).sum().reset_index()

对大熊猫数据框的重复行求和

1 个答案: