Question

我有2个excel文件（可以转换为CSV格式）。

File 1:
Last Name  First Name  id(10 digit)  email   age  course
   abc       def       1234567890    axd     00    y2k
   bcd       efg       9012345875    bxe     11    k2z
   cnn       nbc       5678912345    cxn     00    z2k

File 2:
Group_ID    email     Person_ID  Name(Last,First)
1            axd      1234567890   def,abc
             cxn      5678912345   nbc,cnn

所以我想生成一个文件，在比较file1 [id]和file2 [Person_ID]后会给我结果（我也可以比较file1 [email]和file2 [email]作为Person_ID和email每行应该是唯一的：

bcd       efg       9012345875    bxe     11    k2z

我还没弄明白用什么以及如何使用，但你可以告诉我我可以使用的python df函数。

Answer 1

假设您将文件1和文件2读入pandas数据帧df1和df2，

df1.loc [df1 [＆＃39; id＆＃39;]！= df2 [＆＃39; Person_ID＆＃39;]]

比较2个Excel文件，并根据关键列

1 个答案: