Question

我目前正在研究Titanic数据集。它由4-5个非数字列组成。我想应用sklearn.LabelEncoder类来获取这些非数字列的编码值。毫无疑问，我可以逐个将这种方法应用于每一列。但是，当有超过20-30个这样的专栏时，这项工作将变得更加乏味。既然我知道这些非数字列的名称，是否有任何复杂的方法可以轻松实现？

Answer 1

Just run a loop after selecting object types

obj_cols = df.select_dtypes(include=[object])

for i in obj_cols:
    df[i+'label'] = le.fit_transform(df[i])

LabelEncoding到pandas

1 个答案: