Pandas Groupby和Sum Only One Column

时间:2016-08-16 21:51:55

标签: python pandas

所以我有一个数据帧df1,如下所示:

       A      B      C
1     foo    12    California
2     foo    22    California
3     bar    8     Rhode Island
4     bar    32    Rhode Island
5     baz    15    Ohio
6     baz    26    Ohio

我希望按列A进行分组,然后对列B进行求和,同时将值保留在C列中。如下所示:

      A       B      C
1    foo     34    California
2    bar     40    Rhode Island
3    baz     41    Ohio

问题是,当我说df.groupby(' A')时,sum()列C被删除返回

      B
A
bar  40
baz  41
foo  34

当我分组并求和时,如何解决这个问题并保留C列?

2 个答案:

答案 0 :(得分:21)

执行此操作的唯一方法是在您的groupby中包含C(groupby函数可以接受列表)。

尝试一下:

df.groupby(['A','C'])['B'].sum()

另外需要注意的是,如果在聚合后需要使用df,还可以使用as_index = False选项返回数据框对象。当我第一次和熊猫一起工作时,这个给了我一些问题。例如:

df.groupby(['A','C'], as_index=False)['B'].sum()

答案 1 :(得分:2)

如果您不关心C列中的内容,只想要nth值,则可以这样做:

df.groupby('A').agg({'B' : 'sum',
                     'C' : lambda x: x.iloc[n]})