通过python将多个Excel文件合并为一个Excel文件

时间:2019-11-25 11:11:33

标签: python excel pandas dataframe join

我需要将目录中的所有Excel文件合并为一个Excel文件。 例如,我有3个excel文件:

文件1:

enter image description here

文件2:

enter image description here

文件3:

enter image description here

我需要将它们连接起来并获得如下输出

enter image description here

但相反,它们被一个接一个地附加 这是我的代码:

import pandas as pd
import numpy as np
import glob

all_data = pd.DataFrame()
for f in glob.glob('C:/Users/test-results/FinalResult/05-01-2019/*.xlsx'):
   df = pd.read_excel(f)
   all_data = all_data.append(df, ignore_index=True)

writer = pd.ExcelWriter('mycollected_data.xlsx', engine='xlsxwriter')
all_data.to_excel(writer, sheet_name='Sheet1')
writer.save()

在执行任务期间,我发现所有内容都是如何添加dfs,如我的代码所示,我不知道如何使用join

3 个答案:

答案 0 :(得分:1)

尝试一下:

all_data = pd.concat([all_data,df],axis=1)

答案 1 :(得分:1)

您可以使用

files = glob.glob('C:/Users/test-results/FinalResult/05-01-2019/*.xlsx')
dfs = (pd.read_excel(f, index_col=0) for f in files)
all_data = pd.concat(dfs, axis=1)

答案 2 :(得分:0)

all_data = all_data.join(df, on = ['first_column_name'], how = 'left')