有许多类似的问题,但没有具体的问题。
我有一个数据框列表,我需要使用唯一的列(date)
将它们合并在一起。字段名称不同,因此concat已经出局。
我可以手动使用df[0].merge(df[1],on='Date').merge(df[3],on='Date)
等逐个合并每个df,但问题是列表中的数据帧数量因用户输入而异。
有没有任何合并的方法可以一次性组合列表中的所有数据框?或者也许有些人会在循环中做到这一点?
我正在使用Python 2.7。
答案 0 :(得分:40)
您可以使用reduce
函数,其中dfList
是您的数据框列表:
import pandas as pd
reduce(lambda x, y: pd.merge(x, y, on = 'Date'), dfList)
作为演示:
df = pd.DataFrame({'Date': [1,2,3,4], 'Value': [2,3,3,4]})
dfList = [df, df, df]
dfList
# [ Date Value
# 0 1 2
# 1 2 3
# 2 3 3
# 3 4 4, Date Value
# 0 1 2
# 1 2 3
# 2 3 3
# 3 4 4, Date Value
# 0 1 2
# 1 2 3
# 2 3 3
# 3 4 4]
reduce(lambda x, y: pd.merge(x, y, on = 'Date'), dfList)
# Date Value_x Value_y Value
# 0 1 2 2 2
# 1 2 3 3 3
# 2 3 3 3 3
# 3 4 4 4 4