合并一个pandas数据帧列表

时间:2016-06-29 01:51:11

标签: python pandas dataframe

有许多类似的问题,但没有具体的问题。

我有一个数据框列表,我需要使用唯一的列(date)将它们合并在一起。字段名称不同,因此concat已经出局。

我可以手动使用df[0].merge(df[1],on='Date').merge(df[3],on='Date)等逐个合并每个df,但问题是列表中的数据帧数量因用户输入而异。

有没有任何合并的方法可以一次性组合列表中的所有数据框?或者也许有些人会在循环中做到这一点?

我正在使用Python 2.7。

1 个答案:

答案 0 :(得分:40)

您可以使用reduce函数,其中dfList是您的数据框列表:

import pandas as pd
reduce(lambda x, y: pd.merge(x, y, on = 'Date'), dfList)

作为演示:

df = pd.DataFrame({'Date': [1,2,3,4], 'Value': [2,3,3,4]})
dfList = [df, df, df]
dfList

# [   Date  Value
#  0     1      2
#  1     2      3
#  2     3      3
#  3     4      4,    Date  Value
#  0     1      2
#  1     2      3
#  2     3      3
#  3     4      4,    Date  Value
#  0     1      2
#  1     2      3
#  2     3      3
#  3     4      4]

reduce(lambda x, y: pd.merge(x, y, on = 'Date'), dfList)
#   Date  Value_x  Value_y  Value
# 0    1        2        2      2
# 1    2        3        3      3
# 2    3        3        3      3
# 3    4        4        4      4