如何虚拟具有多个值的熊猫列

时间:2019-12-16 14:18:23

标签: python-3.x pandas dataframe

我有几列的pandas数据框,我想修改它以将其添加到模型中,假设我已经给出了这样的数据集

Name age  routine
  A   12  programming|eat|sleep
  B   13  school|homework|sleep|eat
  C   11  web Developer
  .
  .
  .

并且在此数据的自述文件/文档文件中提到,例程遵循数据的学习,饮食,睡眠,编程,Web开发人员和家庭作业

所以我想像这样转换我的常规列(注意*我在这里不需要值,我想要0和1,以便可以将其传递给我的模型)

Name age  programming eats sleep school homework web-developer
  A   12       1        1    1     0        0          0    
  B   13       0        1    1     1        1          0
  C   11       0        0    0     0        0          1
  .
  .
  .

当我尝试这个

df[['programming','eats', 'sleep', 'school', 'homework', 'web-developer']] = df.routine.str.split('|',expand=True)

我在这里得到了价值,即使他们不在您所看到的正确位置

Name age  programming   eats     sleep school homework web-developer
  A   12  programming   eat      sleep           
  B   13  school        homework sleep eat          
  C   11  web Developer
  .
  .
  .

那我怎样才能得到想要的输出人员,请帮忙

0 个答案:

没有答案