我想使用python匹配两个不同的excel文件中的列

时间:2019-01-13 14:28:38

标签: python

我有两个Excel文件,例如df1.xlsx和df2.xlsx。

data1.xlsx

    Col1

    Aditya1

    Adi

    Aditya_sh

data2.xlsx

    Col1

    Sunil

    Abhishek

    Aditya1

我想将data1.Col1的元素与data2.col1的每一行进行匹配。 如果匹配,则将data1.col1数据写入另一个文件。 以上数据只是一个示例,因此在实际情况下,我在data1中有45k个名称,在data2中有35k个名称

我尝试了以下代码:

data1= pd.read_excel('data1.xlsx')
data2= pd.read_excel('data2.xlsx')
writer = pd.ExcelWriter('output1.xlsx', engine='xlsxwriter')

writer1 = pd.ExcelWriter('output2.xlsx', engine='xlsxwriter')

d1=data1['LEI'].values
d2=data2['LEI'].values

for i in range(len(d1)):
       if d1[i] ==d2[i]:
        data1.to_excel(writer, sheet_name='Sheet1')
    elif
        data1.to_excel(writer1, sheet_name='Sheet1')


Output 

Col1
Aditya1

1 个答案:

答案 0 :(得分:0)

您要查找两列之间的匹配项吗?如果是,请尝试以下

df1 = pd.DataFrame({'col1':['Aditya1','Adi','Aditya_sh']})
df2 = pd.DataFrame({'col1':['Sunil','Abhishek','Aditya1']})
df1.merge(df2,on='col1')

输出-

col1
0   Aditya1