将字符串转换为列-数据框

时间:2018-11-29 14:42:18

标签: python pandas

我有下面的数据框,我打算将其用于ML回归模型。

我想将特征转换为框架上的单独列,如果特征存在则为1,否则为0。这是为了训练我的模型。

例如,如果feature为[cubierta],我想添加一个名为feature_1的新列,其中包含特定行0的值,依此类推,依此类推。

序列列中的项目序列是有序的。这是顺序的。

有没有现成的熊猫方法可以帮助您?

当然可以在功能栏上运行list(df.features),但是我不知道该如何进行。

data frame

1 个答案:

答案 0 :(得分:0)

pd.get_dummies完全满足您的要求:

df = pd.DataFrame({'district':['Eixample', 'Sants-Muntuïc'], 'features':['Cubierta', 'Plaza de coche']})
print(df)

        district        features
0       Eixample        Cubierta
1  Sants-Muntuïc  Plaza de coche

pd.get_dummies(df, columns=['features'])

       district        features_Cubierta  features_Plaza de coche
0      Eixample                  1                        0
1    Sants-Muntuïc               0                        1

沙鲁特:)