我有两组数值数据。一个比另一个大得多。来自较小集合的相同数据多次应用于较大集合。例如,其中B是我需要添加到较大集中的数据,而C是在较大集中引用每个值A的次数:
小套装:
A B C
123 1 2
456 5 3
大集合:
A D
123 45
123 58
456 32
456 22
456 89
所需的输出:
A D B
123 45 1
123 58 1
456 32 5
456 22 5
456 89 5
我只看到有人要删除重复字段的问题;在这里,重要的是我匹配值B,以便可以更好地理解结果D。
答案 0 :(得分:0)
您需要pd.merge
df=pd.merge(df1,df2,on='A')
df=df[['A','D','B']]