我有下面的数据框,我打算将其用于ML回归模型。
我想将特征转换为框架上的单独列,如果特征存在则为1,否则为0。这是为了训练我的模型。
例如,如果feature为[cubierta],我想添加一个名为feature_1的新列,其中包含特定行0的值,依此类推,依此类推。
序列列中的项目序列是有序的。这是顺序的。
有没有现成的熊猫方法可以帮助您?
当然可以在功能栏上运行list(df.features)
,但是我不知道该如何进行。
答案 0 :(得分:0)
pd.get_dummies
完全满足您的要求:
df = pd.DataFrame({'district':['Eixample', 'Sants-Muntuïc'], 'features':['Cubierta', 'Plaza de coche']})
print(df)
district features
0 Eixample Cubierta
1 Sants-Muntuïc Plaza de coche
pd.get_dummies(df, columns=['features'])
district features_Cubierta features_Plaza de coche
0 Eixample 1 0
1 Sants-Muntuïc 0 1
沙鲁特:)