我有2个具有共同唯一ID的数据集(第2个数据框中有重复) 我想根据每个ID映射所有记录。
df1
id
1
2
3
4
5
df2
id col1
1 mango
2 melon
1 straw
3 banana
3 papaya
我希望像
一样df1
id col1
1 mango
straw
2 melon
3 banana
papaya
4 not available
5 not available
提前致谢
答案 0 :(得分:2)
您正在寻找外部df.merge
:
df1 = df1.merge(df2, how='outer').set_index('id').fillna('not available')
>>> df1
col1
id
1 mango
1 straw
2 melon
3 banana
3 papaya
4 not available
5 not available