我有2个excel文件(可以转换为CSV格式)。
File 1:
Last Name First Name id(10 digit) email age course
abc def 1234567890 axd 00 y2k
bcd efg 9012345875 bxe 11 k2z
cnn nbc 5678912345 cxn 00 z2k
File 2:
Group_ID email Person_ID Name(Last,First)
1 axd 1234567890 def,abc
cxn 5678912345 nbc,cnn
所以我想生成一个文件,在比较file1 [id]和file2 [Person_ID]后会给我结果(我也可以比较file1 [email]和file2 [email]作为Person_ID和email每行应该是唯一的:
bcd efg 9012345875 bxe 11 k2z
我还没弄明白用什么以及如何使用,但你可以告诉我我可以使用的python df函数。
答案 0 :(得分:0)
假设您将文件1和文件2读入pandas数据帧df1和df2,
df1.loc [df1 [' id']!= df2 [' Person_ID']]