通过多列合并多个数据框

时间:2020-10-14 03:11:05

标签: python pandas database dataframe merge

我正在尝试合并大约5个数据帧,每个数据帧具有2个变量。每个数据帧都有两个变量。变量是Unique_ID和Year。每个数据帧都有不同数量的观察值。

DF 1

Unique ID        Year
1                2010
2                2010
3                2011

DF 2

Unique ID        Year
3                2010
2                2011
4                2012

合并它们的最佳方法是什么?我不介意重复。我实际上是想看看我有多少。

2 个答案:

答案 0 :(得分:0)

您可以使用functools.partial

import functools
dfs = [df1,df2,df3,df4,df5]
df = functools.partial(pd.merge, on=['Unique_ID', 'Year']) #may have to pass how='outer' or how='left', depending on what you are trying to accomplish

答案 1 :(得分:0)

您可以使用pandas.concat:

merged = pandas.concat([df1,df2,df3,df4,df5])

这将合计您所有的数据框