我正在尝试获取标签编码器的映射,以找出哪些代码在df中获得了列的每个字符串。
这是编码代码:
y[:]=LabelEncoder().fit_transform(y[:])
我想得到这样的输出:
A:1
B:2
C:3
感谢您的帮助!
答案 0 :(得分:2)
如果希望以后可以使用映射或逆变换,则应避免进行行内初始化。
data = ['A', 'A', 'B', 'C', 'B', 'B'] # `y`
le = LabelEncoder()
mapped = le.fit_transform(data)
mapping = dict(zip(le.classes_, range(1, len(le.classes_)+1)))
print(mapping)
# {'A': 1, 'B': 2, 'C': 3}
更好的是,如果您想反转编码,请使用inverse_transform
:
print(le.inverse_transform(mapped))
# ['A' 'A' 'B' 'C' 'B' 'B']