| Col1 | Col2 | Col3 |
|------|------|------|
| m | n | o |
| m | q | e |
| a | b | r |
pandas DataFrame
,如上所示。请注意,col1
和0th
行的1st
值是相同的。有没有办法仅基于duplicate entries
找到数据帧上的所有Col1
。is_duplicate
,该列将为DataFrame的所有重复实例显示True
,否则为False
。注意:我想仅根据
Col1
中的值来查找重复项,其他列可以重复也可以不重复,因此不应该考虑它们。
答案 0 :(得分:1)
.duplicated()确实具有以下功能:
df['is_duplicate'] = df.duplicated('Col1')
答案 1 :(得分:0)
我找到了:
df["is_duplicate"] = df.Col1.duplicated(keep=False)