假设我的数据框看起来像这样:
A B C
X U 500
X S 300
X T 200
Y F 20
Y G 980
Z L 400
我想在A列中使用特定的值{X,Y,Y},并根据这些值,我想取C行总和并将其输出到新的数据帧中。我的新数据框应该像这样
A B
X 1000
Y 1000
Z 400
它实质上是按照名称在A列中对值进行分组,从A中的每个值中获取C的总和,并创建一个新的数据框,其名称在A列中指定,其中包含C列中的总数。
我需要它自己选择这些值,因为想象一下我的数据帧在A列中有200行和80个不同的值。
答案 0 :(得分:2)
使用:
df = df.groupby('A', as_index=False)['B'].sum()
或者:
df = df.groupby('A')['B'].sum().reset_index()