如何在熊猫中找到重复项?

时间:2016-01-15 11:45:20

标签: python pandas

当我使用

时,我的数据框大约有52000行,有些重复
df_drop_duplicates() 

我松散了大约1000行,但我不想删除这些行,我想知道哪些是重复的行

1 个答案:

答案 0 :(得分:3)

您可以使用duplicated

df[df.duplicated()]

您可以从docs:

指定所需内容的keep参数
  

保持 :{'first','last',False},默认为'first'

     
      
  • first:将重复标记为True,但第一次出现除外。
  •   
  • last:将重复标记为True,但最后一次出现除外。
  •   
  • False:将所有重复项标记为True
  •