使用python的数据帧的区别

时间:2019-07-15 09:22:51

标签: python pandas dataframe

我有两个数据帧,我需要比较两个数据帧并以以下格式获取输出数据帧。

DataFrame 1

   ID     NAME   AGE            ADDRESS        SALARY
0  1     Dhoni  24  Kota                       60000.0
1  2     Raina  90  Delhi                      41500.0
2  3     Kholi  67  Ahmedabad                  20000.0
3  4    Ashwin  45  Bhopal                      8500.0
4  5    Watson  64  Mumbai                      6500.0
5  6  KL Rahul  19  Indore                      4500.0
6  7    Hardik  24  Bengaluru                   1000.0

DataFrame 2

   ID   NAME   AGE            ADDRESS        SALARY
0  3     Kholi  67  Ahmedabad                  20000.0
1  7    Hardik  24  Bengaluru                   1000.0
2  4    Ashwin  45  Bhopal                      8500.0
3  2     Raina  90  Delhi                      41500.0
4  6  KL Rahul  19  Indore                      4500.0
5  1     Dhoni  24  Kota                       60000.0
6  5    Watson  64  Mumbai                      6500.0

实际结果应该具有这样的模板。

ID  DF1 - ID    DF2 - ID    DF1 - NAME  DF2 - NAME  DF1 - AGE   DF2 - AGE   DF1 - ADDRESS   DF2 - ADDRESS   DF1 - SALARY    DF2- SALARY

在这里,如果DF1中不存在数据,则DF2 - ID, DF2 - NAME, DF2 - AGE, DF2 - ADDRESS, DF2 - SALARY的值应为空。

如果存在任何差异,则必须以给定的格式填充这些数据作为输出。

ID  DF1 - ID    DF2 - ID    DF1 - NAME  DF2 - NAME  DF1 - AGE   DF2 - AGE   DF1 - ADDRESS   DF2 - ADDRESS   DF1 - SALARY    DF2- SALARY

我尝试将两个数据帧连接起来并获得差异。我以以下格式获取它。

上一个输出图像

我需要我已经提到的必需格式。这是我尝试连接并获得区别的代码。

df = pd.concat([DF1, DF2],sort=False).drop_duplicates(subset=dummy_list, keep=False)

0 个答案:

没有答案