我有一个这样的数据框,
df
col1 col2 col3
A X 6
B Y 9
C Z 10
B Y 11
F P 7
G H 8
D Y 4
G H 4
现在,如果col1和col2值重复,我想添加行的col3值。例如,
B-Y-9和B-Y-11是重复的。所以这两行将变成单行B-Y-20
所以最终的数据帧应该看起来像
col1 col2 col3
A X 6
C Z 10
B Y 20
F P 7
D Y 4
G H 12
我可以使用for循环并将行与先前的行进行比较。但是执行时间会更多,需要寻找一些熊猫捷径/ pythonic方式来高效地执行。
答案 0 :(得分:1)
df.groupby(['col1', 'col2']).sum().reset_index()