在我为sklearn中的目标变量使用LabelEncoder时,如何解码多类?

时间:2020-05-24 22:12:09

标签: python scikit-learn nlp data-science multilabel-classification

我正在尝试解决一个多分类问题,目标变量包含性别(男,女)。我使用了sklearn的LabelEncoder实现了一种热编码。我绘制了一个混淆矩阵,得到的输出包含0和1而不是类。我如何能够找回哪个类映射到哪个二进制数(0,1等)?任何建议将非常有帮助。

从sklearn.preprocessing导入LabelEncoder

encoder = LabelEncoder()

y = encoder.fit_transform(y)

1 个答案:

答案 0 :(得分:0)

只需使用inverse_transform:

from sklearn import preprocessing

le = preprocessing.LabelEncoder()
data = ['apple', 'orange', 'pinaple', 'orange']
le.fit(data)

encoded = le.transform(data)

>>> [0 1 2 1]

decoded = le.inverse_transform(encoded)

>>> ['apple' 'orange' 'pinaple' 'orange']

在询问之前也请尝试阅读文档,其中有很多示例: https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html