我正在使用MovieLens数据集,而电影csv看起来像这样:
如何爆炸“类型”列,以使每部电影都有一个类型,所以:
movieId title genres
1 "Toy Story (1995)" Adventure
1 "Toy Story (1995)" Animation
1 "Toy Story (1995)" Children
1 "Toy Story (1995)" Comedy
1 "Toy Story (1995)" Fantasy
2 "Jumanji (1995)" Adventure
...
答案 0 :(得分:1)
在熊猫版本0.25.0之后,我们可以做explode
df=df.assign(genres=df.genres.str.split('|')).explode('genres')