我有一个只有一列的数据框,我需要返回3种最常见的类型。
输入
genres
0 Drama
1 Animation|Children's|Musical
2 Musical|Romance
3 Drama
4 Animation|Children's|Comedy
5 Action|Adventure|Comedy|Romance
6 Action|Adventure|Drama
7 Comedy|Drama
8 Animation|Children's|Musical
9 Adventure|Children's|Drama|Musical
10 Animation|Children's|Musical
11 Musical
12 Drama
13 Comedy
戏剧6 音乐剧6 儿童5 动画4 喜剧片4 冒险3 动作2
输出-具有以下内容的数据框:
genres
0 Drama
1 Musical
2 Children's
答案 0 :(得分:1)
您首先需要split
,然后执行stack
,然后使用value_counts
df.genres.str.split('|',expand=True).stack().value_counts().head(3)
Drama 6
Musical 6
Children's 5
dtype: int64