当我使用
时,我的数据框大约有52000行,有些重复df_drop_duplicates()
我松散了大约1000行,但我不想删除这些行,我想知道哪些是重复的行
答案 0 :(得分:3)
您可以使用duplicated
:
df[df.duplicated()]
您可以从docs:
指定所需内容的keep
参数
保持 :{'first','last',False},默认为'first'
first
:将重复标记为True
,但第一次出现除外。last
:将重复标记为True
,但最后一次出现除外。False
:将所有重复项标记为True
。