Groupby用逗号分隔总和

时间:2015-11-13 18:05:25

标签: python pandas

我有一个python数据框,当我使用这个命令df.groupby(['A','B'])['C'].sum()时,我将列C的对象作为一个,因为它们是字符串。我想得的是C的所有值,用逗号分隔。

我现在得到的结果:

    A B 
    x y klmn
    z y jk
    l c io

我想要的是什么:

A B 
x y k,l,m,n
z y j,k
l c i,o

有什么建议吗? 感谢

1 个答案:

答案 0 :(得分:1)

使用join显式添加分隔符,而不能用sum:

df.groupby(['A','B'])['C'].apply(", ".join)
In [11]: ", ".join(["a", "b", "c"])
Out[11]: 'a, b, c'