我有2个数据框:
df1=pd.DataFrame({
'col0': ['A', 'B', 'C', 'A'],
'col1': ['aa', 'bb', 'cc', 'aa']})
df2=pd.DataFrame({
'col0': ['A', 'B', 'E', 'F','A'],
'col1': ['aa', 'kk', 'cc','bb' ,'nn']})
如何合并它们,以便获得:
col0 col1
0 A aa, nn
1 B bb,kk
2 C cc
3 E cc
4 F bb
答案 0 :(得分:1)
将concat
与DataFrame.drop_duplicates
一起使用并汇总join
:
df = (pd.concat([df1, df2])
.drop_duplicates()
.groupby('col0')['col1']
.agg(','.join)
.reset_index())
print (df)
col0 col1
0 A aa,nn
1 B bb,kk
2 C cc
3 E cc
4 F bb