使用pandas数据框,如何在特定列中查找重复值?

时间:2017-10-12 02:43:25

标签: pandas pandas-groupby

我有一个包含多列的数据框。我做了dataFrame.groupby:

data_count = data.groupby('member_id')

我无法找到下一步查找具有相同member_id的行。

我想在' member_id'中找到每个类别的重复行数。 例如 memer_id 1 1 1 2 2 输出应该是 member_id计数 1 3 2 2

P.S:我可以想到成千上万的解决方法,比如写循环等等。但是这样做的最短路径是什么?

这个非常基本的问题。我提到了stackoverflow和pandas文档,但是当涉及到python时,谷歌搜索和文档甚至没有帮助甚至找到基本的功能。

1 个答案:

答案 0 :(得分:0)

如果您只想要value_counts()显示的不同值的计数,

member_id将执行您想要的操作。也就是说,使用

data['member_id'].value_counts()

顺便说一句,如果您对如何使用groupby实现此目标感到好奇,可以使用.aggregate('count').count(),如下所示:

data.groupby('member_id').count()

data.groupby('member_id')['some_other_field'].count()

如果你想避免冗余计算所有其他字段。