我有一个包含许多列的Pandas数据框,其中一个是"电影标题",我想找到出现在大多数行中的前5个电影标题,并按降序排列。
例如:
movie title
Title 1
Title 2
Title 2
Title 3
Title 3
Title 3
应该成为:
movie title count
Title 3 3
Title 2 2
Title 1 1
它可以位于相同或新的数据框中。我可能错过了一个简单的解决方案,因为我对熊猫来说是一个非常新的东西。谢谢你的帮助!
答案 0 :(得分:0)
试
df.groupby('movie title')['movie title'].aggregate(['count']).reset_index().sort('count', ascending=False)
或一步一步
df = df.groupby('movie title')['movie title'].aggregate(['count'])
df = df.reset_index()
df = df.sort('count', ascending=False)
聚合内的'[]'很重要