查找重复项并创建一列以指出熊猫中的重复项

时间:2020-07-24 20:31:58

标签: python-3.x pandas

| Col1 | Col2 | Col3 |
|------|------|------|
| m    | n    | o    |
| m    | q    | e    |
| a    | b    | r    |
  • 假设我有一个pandas DataFrame,如上所示。请注意,col10th行的1st值是相同的。有没有办法仅基于duplicate entries找到数据帧上的所有Col1
  • 此外,我还想添加另一列is_duplicate,该列将为DataFrame的所有重复实例显示True,否则为False

注意:我想仅根据Col1中的值来查找重复项,其他列可以重复也可以不重复,因此不应该考虑它们。

2 个答案:

答案 0 :(得分:1)

.duplicated()确实具有以下功能:

df['is_duplicate'] = df.duplicated('Col1')

答案 1 :(得分:0)

我找到了:

df["is_duplicate"] = df.Col1.duplicated(keep=False)