检测并保存熊猫数据框中的重复行

时间:2021-04-13 17:49:41

标签: pandas duplicates

我有一个包含多列的 Pandas 数据框,格式如下:

Test 1 s< a test test 1<,tasa> <foo>
 this
</foo> zzz

我正在尝试根据“Id”列检测重复行并保留这两行。因此,在结果中它必须是

Id    Year    Month   
123   2021    02
123   2021    02
345   2021    03
345   2021    03
567   2021    04

我正在尝试此代码:

Id    Year    Month   
123   2021    02
123   2021    02
345   2021    03
345   2021    03

但它并没有产生预期的结果。任何建议将不胜感激。

1 个答案:

答案 0 :(得分:2)

使用keep=False

df[df.duplicated('Id', keep=False)]