LabelEncoding到pandas

时间:2017-12-17 03:38:48

标签: python machine-learning scikit-learn dataset sklearn-pandas

我目前正在研究Titanic数据集。它由4-5个非数字列组成。我想应用sklearn.LabelEncoder类来获取这些非数字列的编码值。毫无疑问,我可以逐个将这种方法应用于每一列。但是,当有超过20-30个这样的专栏时,这项工作将变得更加乏味。既然我知道这些非数字列的名称,是否有任何复杂的方法可以轻松实现?

1 个答案:

答案 0 :(得分:-1)

Just run a loop after selecting object types

obj_cols = df.select_dtypes(include=[object])

for i in obj_cols:
    df[i+'label'] = le.fit_transform(df[i])