比较2个Excel文件,并根据关键列

时间:2016-09-26 17:02:28

标签: python csv pandas

我有2个excel文件(可以转换为CSV格式)。

File 1:
Last Name  First Name  id(10 digit)  email   age  course
   abc       def       1234567890    axd     00    y2k
   bcd       efg       9012345875    bxe     11    k2z
   cnn       nbc       5678912345    cxn     00    z2k

File 2:
Group_ID    email     Person_ID  Name(Last,First)
1            axd      1234567890   def,abc
             cxn      5678912345   nbc,cnn

所以我想生成一个文件,在比较file1 [id]和file2 [Person_ID]后会给我结果(我也可以比较file1 [email]和file2 [email]作为Person_ID和email每行应该是唯一的:

bcd       efg       9012345875    bxe     11    k2z

我还没弄明白用什么以及如何使用,但你可以告诉我我可以使用的python df函数。

1 个答案:

答案 0 :(得分:0)

假设您将文件1和文件2读入pandas数据帧df1和df2,

df1.loc [df1 [' id']!= df2 [' Person_ID']]