按确定的元素爆炸熊猫行

时间:2020-03-17 19:26:38

标签: pandas dataframe pandasql

我正在使用MovieLens数据集,而电影csv看起来像这样:

enter image description here

如何爆炸“类型”列,以使每部电影都有一个类型,所以:

movieId       title                  genres

1            "Toy Story (1995)"      Adventure

1            "Toy Story (1995)"      Animation

1            "Toy Story (1995)"      Children

1            "Toy Story (1995)"      Comedy

1            "Toy Story (1995)"      Fantasy

2            "Jumanji (1995)"        Adventure
...

1 个答案:

答案 0 :(得分:1)

在熊猫版本0.25.0之后,我们可以做explode

df=df.assign(genres=df.genres.str.split('|')).explode('genres')