我有两个数据框:
df1:
和df2:
我想将col1
的{{1}}与df1
的{{1}}进行匹配。如果它们匹配,那么我想从col_new
中提取第一个df2
。
我想要的输出是:
我正在使用以下代码:
label
但是它正在创建更多的记录,因为有多个标签分配给单个值。
答案 0 :(得分:1)
尝试一下:
out = (df1.drop_duplicates('col1').merge(df2, left_on='col1', right_on='col_new'))
如果有重复项,它假定仅保留df1中的第一个值。