我在A列中有一个仅包含“雇员ID”的Excel工作表,如下所示。
1677
5597
5623
5618
我还有一张Excel工作表,其中包含10000+名员工的“员工详细信息”。例如:员工详细信息excel表包含包含很多员工的数据,这是下面显示的员工ID的示例。
Empid Name Location JobTitle Email-id Department
1677 Umesh Gadag ASE abc@gmail.com Civil
这是工作代码
import pandas as pd
df1 = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Employee id.xlsx',header=None)# excel sheet containing only ids
df2= pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Employee details.xlsx)# excel sheet containing all details of 10000+ employees
df3 = df2[df2['Empid'].isin(df1[0])]
df3.to_excel("Output1.xlsx",index=False)#Final output
代码工作正常,但我会以随机方式输出
Empid Name Location JobTitle Email-id Department
1677 Umesh Gadag ASE abc@gmail.com Civil
5623 Kiran Hubli SE 123@gmail.com Civil
5618 Rudra Bidar ASE xyz@gmail.com Electrical
5597 Suresh Udupi ASE ppp@gmail.com Mechanical
但是我需要按以下顺序输出,因为Employee ID按特定顺序排列。基本上,我在员工ID详细信息中给出的顺序是什么,我需要按如下所示的相同顺序获取员工详细信息。
Empid Name Location JobTitle Email-id Department
1677 Umesh Gadag ASE abc@gmail.com Civil
5597 Suresh Udupi ASE ppp@gmail.com Mechanical
5623 Kiran Hubli SE 123@gmail.com Civil
5618 Rudra Bidar ASE xyz@gmail.com Electrical
答案 0 :(得分:2)
这是一个解决方案:
df1 = df1.reset_index().rename(columns= {"index": "order"})
res = pd.merge(df1, df2, on = "Empid").sort_values("order").drop("order", axis=1)
输出为:
Empid Name Location JobTitle Email-id Department
0 1677 Umesh Gadag ASE abc@gmail.com Civil
1 5597 Suresh Udupi ASE ppp@gmail.com Mechanical
2 5623 Kiran Hubli SE 123@gmail.com Civil
3 5618 Rudra Bidar ASE xyz@gmail.com Electrical