我有一个python数据框,当我使用这个命令df.groupby(['A','B'])['C'].sum()
时,我将列C的对象作为一个,因为它们是字符串。我想得的是C的所有值,用逗号分隔。
我现在得到的结果:
A B
x y klmn
z y jk
l c io
我想要的是什么:
A B
x y k,l,m,n
z y j,k
l c i,o
有什么建议吗? 感谢
答案 0 :(得分:1)
使用join显式添加分隔符,而不能用sum:
df.groupby(['A','B'])['C'].apply(", ".join)
In [11]: ", ".join(["a", "b", "c"])
Out[11]: 'a, b, c'