根据特定列组合两个数据框

时间:2019-11-24 21:36:17

标签: python pandas dataframe

我正在尝试为NBA数据组合不同的数据帧。我的第一个数据帧来自basketball-reference页面,而我的第二个数据帧来自538 stats page。我已经对它们进行了抓取。

我想将它们组合在一起,以便按播放器名称显示。其中一个数据框仍然大于另一个。如何将数据框组合在一起?两者的列ID均为“玩家”

1 个答案:

答案 0 :(得分:0)

我认为您可能想使用pandas .merge()。

import pandas as pd

df1 = pd.DataFrame({'player': ['foo', 'bar', 'baz', 'foo', 'bar', 'foo'],
               'value': [1, 2, 3, 5, 7, 9]})
df2 = pd.DataFrame({'player': ['foo', 'bar', 'baz', 'foo'],
                 'value': [5, 6, 7, 8]})

merged_df  = df1.merge(df2, how='outer', on='player')