我有一个这样的熊猫数据框:
Column1 Column2
0 a jack
1 a peter
2 b anna
3 c rose
4 c pupp
我现在想做的是获取一个包含第1列和第2列的新数据框,如果row1 == row2然后输出第2列的值,则第2列应该得到,输出应该是这样的
Column1 Column2
0 a jack,peter
1 b anna
2 c rose,pupp
我如何最好地解决这个问题?任何意见将是有益的。提前致谢!
答案 0 :(得分:3)
我认为需要groupby
和join
:
df = df.groupby('Column1')['Column2'].apply(', '.join).reset_index()
print (df)
Column1 Column2
0 a jack, peter
1 b anna
2 c rose, pupp