我有一列Profile ID
。我想将此profile ID
与所有其他先前的配置文件ID进行比较,看看它是新的还是重复的
例如,我有两列:
Profile ID Duploicate/Unique
1 Unique
1 Duplicate
2 Unique
3 Unique
2 Duplicate
我想要这样的结果来比较每个值和每个先前的值。
答案 0 :(得分:2)
将numpy.where
与Series.duplicated
一起使用:
df['Duplicate/Unique1'] = np.where(df['Profile ID'].duplicated(),'Duplicate','Unique')
print (df)
Profile ID Duplicate/Unique Duplicate/Unique1
0 1 Unique Unique
1 1 Duplicate Duplicate
2 2 Unique Unique
3 3 Unique Unique
4 2 Duplicate Duplicate