我正在尝试为NBA数据组合不同的数据帧。我的第一个数据帧来自basketball-reference页面,而我的第二个数据帧来自538 stats page。我已经对它们进行了抓取。
我想将它们组合在一起,以便按播放器名称显示。其中一个数据框仍然大于另一个。如何将数据框组合在一起?两者的列ID均为“玩家”
答案 0 :(得分:0)
我认为您可能想使用pandas .merge()。
import pandas as pd
df1 = pd.DataFrame({'player': ['foo', 'bar', 'baz', 'foo', 'bar', 'foo'],
'value': [1, 2, 3, 5, 7, 9]})
df2 = pd.DataFrame({'player': ['foo', 'bar', 'baz', 'foo'],
'value': [5, 6, 7, 8]})
merged_df = df1.merge(df2, how='outer', on='player')