df.groupby(['foo'])[['bar']].count()
这是我应用这个群组得到的。 我希望能够做的只是保留第3项和第4项,因为它们是唯一具有相同数量' bar的项目。有没有办法可以存储字符串' Item3'和' Item4'进入清单?我为可怕的格式道歉,我是新手。
答案 0 :(得分:0)
只需在duplicated
.index.tolist()
然后再添加groupby
df.groupby(['foo'])[['bar']].count().duplicated(keep=False).index.tolist()
Out[320]: ['ITEM3', 'ITEM4']