将列从一个熊猫DataFrame映射到另一个

时间:2020-07-25 20:07:18

标签: python pandas

我有一个这样的数据框:

df_1 = pd.DataFrame({'players.name': ['John', 'Will' ,'John', 'Jim', 'Tim', 'John', 'Will', 'Tim'],
                     'players.diff': [0, 0, 0, 0, 0, 0, 0, 0],
                            'count': [3, 2, 3, 1, 2, 3, 2, 2]})

“计数”值是恒定的。


我有一个不同的形状数据框,其中播放器的顺序不同,如下所示:

df_2 = pd.DataFrame({'players.name': ['Will', 'John' ,'Jim'],
                     'players.diff': [0, 0, 0]})

如何从df_1值映射并在df_2上填充“计数”值,最后以:

  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1

3 个答案:

答案 0 :(得分:3)

由于您只是尝试创建一列计数,所以map您的球员姓名来计数将更有意义:

df_2['counts'] = df_2['players.name'].map(
    df_1.groupby('players.name')['count'].first())

df_2 

  players.name  players.diff  counts
0         Will             0       2
1         John             0       3
2          Jim             0       1

答案 1 :(得分:1)

您的样本df_1已复制了players.name,且计数相同,因此您需要左合并和drop_duplicates

new_df_2 = df_2.merge(df_1[['players.name','count']], on='players.name', how='left').drop_duplicates()

Out[89]:
  players.name  players.diff  count
0         Will             0      2
2         John             0      3
5          Jim             0      1

答案 2 :(得分:1)

这可能有效:

pd.merge(df_1, df_2, on=["players.name", "players.diff"]).drop_duplicates()