我给出了这种类型的数据集(数据帧):
x y
A a
A b
B c
C g
B g
这是我对多标签分类所需要的 -
x y
A a,b
B c,g
C g
我应该怎么做?
答案 0 :(得分:2)
选项1
将groupby
与','.join
df.groupby('x').y.apply(','.join).reset_index()
x y
0 A a,b
1 B c,g
2 C g
选项2
将pivot_table
与','.join
df.pivot_table('y', 'x', aggfunc=','.join).reset_index()
x y
0 A a,b
1 B c,g
2 C g