我有一个包含多列的数据框。我做了dataFrame.groupby:
data_count = data.groupby('member_id')
我无法找到下一步查找具有相同member_id的行。
我想在' member_id'中找到每个类别的重复行数。 例如 memer_id 1 1 1 2 2 输出应该是 member_id计数 1 3 2 2
P.S:我可以想到成千上万的解决方法,比如写循环等等。但是这样做的最短路径是什么?
这个非常基本的问题。我提到了stackoverflow和pandas文档,但是当涉及到python时,谷歌搜索和文档甚至没有帮助甚至找到基本的功能。
答案 0 :(得分:0)
value_counts()
显示的不同值的计数, member_id
将执行您想要的操作。也就是说,使用
data['member_id'].value_counts()
顺便说一句,如果您对如何使用groupby
实现此目标感到好奇,可以使用.aggregate('count')
或.count()
,如下所示:
data.groupby('member_id').count()
或
data.groupby('member_id')['some_other_field'].count()
如果你想避免冗余计算所有其他字段。