Question

我有一个包含多列的 Pandas 数据框，格式如下：

Test 1 s< a test test 1<,tasa> <foo>
 this
</foo> zzz

我正在尝试根据“Id”列检测重复行并保留这两行。因此，在结果中它必须是

Id    Year    Month   
123   2021    02
123   2021    02
345   2021    03
345   2021    03
567   2021    04

我正在尝试此代码：

Id    Year    Month   
123   2021    02
123   2021    02
345   2021    03
345   2021    03

但它并没有产生预期的结果。任何建议将不胜感激。

Answer 1

使用keep=False：

df[df.duplicated('Id', keep=False)]