我有一个这样的数据框:
df_1 = pd.DataFrame({'players.name': ['John', 'Will' ,'John', 'Jim', 'Tim', 'John', 'Will', 'Tim'],
'players.diff': [0, 0, 0, 0, 0, 0, 0, 0],
'count': [3, 2, 3, 1, 2, 3, 2, 2]})
“计数”值是恒定的。
我有一个不同的形状数据框,其中播放器的顺序不同,如下所示:
df_2 = pd.DataFrame({'players.name': ['Will', 'John' ,'Jim'],
'players.diff': [0, 0, 0]})
如何从df_1
值映射并在df_2
上填充“计数”值,最后以:
players.name players.diff counts
0 Will 0 2
1 John 0 3
2 Jim 0 1
答案 0 :(得分:3)
由于您只是尝试创建一列计数,所以map
您的球员姓名来计数将更有意义:
df_2['counts'] = df_2['players.name'].map(
df_1.groupby('players.name')['count'].first())
df_2
players.name players.diff counts
0 Will 0 2
1 John 0 3
2 Jim 0 1
答案 1 :(得分:1)
您的样本df_1
已复制了players.name
,且计数相同,因此您需要左合并和drop_duplicates
new_df_2 = df_2.merge(df_1[['players.name','count']], on='players.name', how='left').drop_duplicates()
Out[89]:
players.name players.diff count
0 Will 0 2
2 John 0 3
5 Jim 0 1
答案 2 :(得分:1)
这可能有效:
pd.merge(df_1, df_2, on=["players.name", "players.diff"]).drop_duplicates()