在fit_transform之后获取sklearn.LabelEncoder()映射

时间:2018-12-11 05:30:42

标签: python python-3.x scikit-learn

我正在尝试获取标签编码器的映射,以找出哪些代码在df中获得了列的每个字符串。

这是编码代码:

y[:]=LabelEncoder().fit_transform(y[:])

我想得到这样的输出:

A:1
B:2
C:3

感谢您的帮助!

1 个答案:

答案 0 :(得分:2)

如果希望以后可以使用映射或逆变换,则应避免进行行内初始化。

data = ['A', 'A', 'B', 'C', 'B', 'B'] # `y`

le = LabelEncoder()
mapped = le.fit_transform(data)

mapping = dict(zip(le.classes_, range(1, len(le.classes_)+1)))
print(mapping)
# {'A': 1, 'B': 2, 'C': 3}

更好的是,如果您想反转编码,请使用inverse_transform

print(le.inverse_transform(mapped))
# ['A' 'A' 'B' 'C' 'B' 'B']