我有一个包含多列的 Pandas 数据框,格式如下:
Test 1 s< a test test 1<,tasa> <foo>
this
</foo> zzz
我正在尝试根据“Id”列检测重复行并保留这两行。因此,在结果中它必须是
Id Year Month
123 2021 02
123 2021 02
345 2021 03
345 2021 03
567 2021 04
我正在尝试此代码:
Id Year Month
123 2021 02
123 2021 02
345 2021 03
345 2021 03
但它并没有产生预期的结果。任何建议将不胜感激。
答案 0 :(得分:2)
使用keep=False
:
df[df.duplicated('Id', keep=False)]