pandas - 突出显示重复数据行

时间:2018-05-01 11:13:46

标签: pandas dataframe

改善我的问题

如何检查是否存在相同的Cntr_No和相同的Total_Amount

' HLBU 1234567'和100是重复的。

数据:

 df1 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
 df2 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})    

输出:

  Cntr_No         Total_Amount     Duplicate
0  HLBU 1234567           100         Yes
1  HLBU 1234567           100         Yes

1 个答案:

答案 0 :(得分:0)

您可以使用pd.DataFrame.duplicated将重复的行作为一个系列获取。关键字keep = False会将所有重复项标记为True。然后,地图将True / False值重命名为Yes / No。

df1['Duplicate'] = df1.duplicated(keep=False).map({True:'Yes', False:'No'})