如何过滤数据框以仅在多列中显示重复的行?
示例数据框:
col1 col2 col3
A1 B1 C1
A1 B1 C1
A1 B1 C2
A2 B2 C2
预期产出:
col1 col2 col3
A1 B1 C1
A1 B1 C1
我的尝试:
df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]
但这并没有给出预期的结果。
答案 0 :(得分:1)
您的尝试df[df.duplicated(['col1', 'col2', 'col3'], keep=False)]
适用于我的测试。您可以省略列名称:
df[df.duplicated(keep=False)]