我有两个数据框,格式如下:
第一个:
name series age color
aaa x1 43 yellow
bbb y1 32 blue
bbb y1 23 red
第二个:
name series def
aaa x1 1
bbb y1 1
bbb y1 0
在两列上使用普通合并
pd.merge(df1, df2, on=["series", "name"])
我得到以下数据框:
name series age color def
aaa x1 43 yellow 1
bbb y1 32 blue 1
bbb y1 32 blue 0
bbb y1 23 red 1
bbb y1 23 red 0
但是我打算将第一项与第二栏中的第一项合并,所以:
name series age color def
aaa x1 43 yellow 1
bbb y1 32 blue 1
bbb y1 23 red 0
我该如何合并以消除重复项? 我当时想用索引号创建一个新列,然后合并到3个列中,但是也许有更聪明的解决方案?