如何计算python熊猫中最常见的3种类型?

时间:2018-11-22 18:10:13

标签: python pandas data-science

我有一个只有一列的数据框,我需要返回3种最常见的类型。

  

输入

    genres
0   Drama
1   Animation|Children's|Musical
2   Musical|Romance
3   Drama
4   Animation|Children's|Comedy
5   Action|Adventure|Comedy|Romance
6   Action|Adventure|Drama
7   Comedy|Drama
8   Animation|Children's|Musical
9   Adventure|Children's|Drama|Musical
10  Animation|Children's|Musical
11  Musical
12  Drama
13  Comedy

戏剧6 音乐剧6 儿童5 动画4 喜剧片4 冒险3 动作2

  

输出-具有以下内容的数据框:

  genres
0 Drama
1 Musical
2 Children's

1 个答案:

答案 0 :(得分:1)

您首先需要split,然后执行stack,然后使用value_counts

df.genres.str.split('|',expand=True).stack().value_counts().head(3)
Drama         6
Musical       6
Children's    5
dtype: int64