如何拆分和正确重命名列熊猫

时间:2020-08-19 11:04:37

标签: python pandas split

我正在处理Movielens数据集,我想将“流派”列拆分为多列(每种流派一个),重命名它们并插入0或1,具体取决于电影是否在相应流派中。 / p>

数据集原样

item_id title               genre   
    1   Toy Story (1995)    Animation|Children's|Comedy
    150 Apollo 13 (1995)    Drama
    260 Star Wars (1977)    Action|Adventure|Fantasy|Sci-Fi 

我希望拥有的东西

item_id       title            Action  Animation   Children's  Comedy  Fantasy  Musical  Sci-Fi 
        1   Toy Story (1995)    0        1           1          1       0       0         0
        150 Apollo 13 (1995)    0        0           0          1       0       0         0
        260 Star Wars (1977)    1        0           0          0       1       0         1

因此,我想将该列分为几列,对这些列进行重命名(也许应该首先完成,因为存在许多不同的流派),如果该电影属于给定的电影流派,那么我要填充1。

df.genre.str.split("|", expand= True)

代码会拆分但不能正确执行,因为在同一列中存在不同的流派:

    0             1            2     3       4        5
0   Animation   Children's  Comedy  None    None    None
1   Animation   Children's  Musical Romance None    None

提前谢谢!

0 个答案:

没有答案