改善我的问题
如何检查是否存在相同的Cntr_No和相同的Total_Amount
' HLBU 1234567'和100是重复的。
数据:
df1 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
df2 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
输出:
Cntr_No Total_Amount Duplicate
0 HLBU 1234567 100 Yes
1 HLBU 1234567 100 Yes
答案 0 :(得分:0)
您可以使用pd.DataFrame.duplicated
将重复的行作为一个系列获取。关键字keep = False
会将所有重复项标记为True。然后,地图将True / False值重命名为Yes / No。
df1['Duplicate'] = df1.duplicated(keep=False).map({True:'Yes', False:'No'})