Question

我正在使用MovieLens数据集，而电影csv看起来像这样：

如何爆炸“类型”列，以使每部电影都有一个类型，所以：

movieId       title                  genres

1            "Toy Story (1995)"      Adventure

1            "Toy Story (1995)"      Animation

1            "Toy Story (1995)"      Children

1            "Toy Story (1995)"      Comedy

1            "Toy Story (1995)"      Fantasy

2            "Jumanji (1995)"        Adventure
...

Answer 1

在熊猫版本0.25.0之后，我们可以做explode

df=df.assign(genres=df.genres.str.split('|')).explode('genres')

按确定的元素爆炸熊猫行

1 个答案: