我正在处理Movielens数据集,我想将“流派”列拆分为多列(每种流派一个),重命名它们并插入0或1,具体取决于电影是否在相应流派中。 / p>
数据集原样
item_id title genre
1 Toy Story (1995) Animation|Children's|Comedy
150 Apollo 13 (1995) Drama
260 Star Wars (1977) Action|Adventure|Fantasy|Sci-Fi
我希望拥有的东西
item_id title Action Animation Children's Comedy Fantasy Musical Sci-Fi
1 Toy Story (1995) 0 1 1 1 0 0 0
150 Apollo 13 (1995) 0 0 0 1 0 0 0
260 Star Wars (1977) 1 0 0 0 1 0 1
因此,我想将该列分为几列,对这些列进行重命名(也许应该首先完成,因为存在许多不同的流派),如果该电影属于给定的电影流派,那么我要填充1。
df.genre.str.split("|", expand= True)
代码会拆分但不能正确执行,因为在同一列中存在不同的流派:
0 1 2 3 4 5
0 Animation Children's Comedy None None None
1 Animation Children's Musical Romance None None
提前谢谢!