Python在多列中查找重复项

时间:2018-03-03 02:50:24

标签: python pandas

如何过滤数据框以仅在多列中显示重复的行?

示例数据框:

col1 col2 col3
A1    B1   C1
A1    B1   C1
A1    B1   C2
A2    B2   C2

预期产出:

col1 col2 col3
A1    B1   C1
A1    B1   C1

我的尝试:

df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]

但这并没有给出预期的结果。

1 个答案:

答案 0 :(得分:1)

您的尝试df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]适用于我的测试。您可以省略列名称:

df[df.duplicated(keep=False)]