我有一个包含多个奥斯卡获奖者的数据集。我有以下几列:获奖者的姓名,奖项,出生地,出生日期和年份。我想检查每年填充多少行。假设2005年我们获得了最佳导演和最佳男主角的奖项,而2006年我们获得了最佳男配角的获奖者。我想得到这样的结果:
year_of_award行数
2005年2
2006年1
它看起来很简单,但我做对了。我发现的大多数帖子都建议将group by与count()结合使用。 但是,当我编写下面的代码时,我得到了所有列的行数。因此,我将年份和其他4列填充为行数。
df.groupby(['year_of_award']).count()
如何获取年份和行数?
答案 0 :(得分:2)
尝试大熊猫0.25 +
df.groupby(['year_of_award']).agg(number_of_rows=('award': 'count'))
其他
df.groupby(['year_of_award']).agg({'award': 'count'}).rename(columns={'count': 'number_of_rows'})