Question

当我使用

时，我的数据框大约有52000行，有些重复

df_drop_duplicates()

我松散了大约1000行，但我不想删除这些行，我想知道哪些是重复的行

Answer 1

您可以使用duplicated：

df[df.duplicated()]

您可以从docs：

指定所需内容的keep参数

保持 ：{'first'，'last'，False}，默认为'first'


first：将重复标记为True，但第一次出现除外。

last：将重复标记为True，但最后一次出现除外。

False：将所有重复项标记为True。