我有两个数据帧,我需要比较两个数据帧并以以下格式获取输出数据帧。
DataFrame 1
ID NAME AGE ADDRESS SALARY
0 1 Dhoni 24 Kota 60000.0
1 2 Raina 90 Delhi 41500.0
2 3 Kholi 67 Ahmedabad 20000.0
3 4 Ashwin 45 Bhopal 8500.0
4 5 Watson 64 Mumbai 6500.0
5 6 KL Rahul 19 Indore 4500.0
6 7 Hardik 24 Bengaluru 1000.0
DataFrame 2
ID NAME AGE ADDRESS SALARY
0 3 Kholi 67 Ahmedabad 20000.0
1 7 Hardik 24 Bengaluru 1000.0
2 4 Ashwin 45 Bhopal 8500.0
3 2 Raina 90 Delhi 41500.0
4 6 KL Rahul 19 Indore 4500.0
5 1 Dhoni 24 Kota 60000.0
6 5 Watson 64 Mumbai 6500.0
实际结果应该具有这样的模板。
ID DF1 - ID DF2 - ID DF1 - NAME DF2 - NAME DF1 - AGE DF2 - AGE DF1 - ADDRESS DF2 - ADDRESS DF1 - SALARY DF2- SALARY
在这里,如果DF1中不存在数据,则DF2 - ID, DF2 - NAME, DF2 - AGE, DF2 - ADDRESS, DF2 - SALARY
的值应为空。
如果存在任何差异,则必须以给定的格式填充这些数据作为输出。
ID DF1 - ID DF2 - ID DF1 - NAME DF2 - NAME DF1 - AGE DF2 - AGE DF1 - ADDRESS DF2 - ADDRESS DF1 - SALARY DF2- SALARY
我尝试将两个数据帧连接起来并获得差异。我以以下格式获取它。
上一个输出图像
我需要我已经提到的必需格式。这是我尝试连接并获得区别的代码。
df = pd.concat([DF1, DF2],sort=False).drop_duplicates(subset=dummy_list, keep=False)