如何在文本分类中具有多输出?

时间:2019-05-22 12:03:49

标签: python scikit-learn nlp text-classification

我正在对方言文本进行分类。问题是一些推文,可以分为方言A和B,该怎么办?我要先做,然后自动计算精度,我不想手动做。当我不将它们同时分类为A和B时,它给了我许多错误分类的文本。

尽管在培训中,它们没有被同时归为方言A和B。

1 个答案:

答案 0 :(得分:1)

使用OneHotEncoding

from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder

# Your target will look similar to
target = ['A', 'A', 'B']

# After OneHotEncoding
[[1, 0],
 [1, 0],
 [0, 1]]

在完成此目标的训练之后,您的模型将预测上课的可能性。您可以设置阈值以将预测分类为两个类

# Sample output
[[1., 0.],
 [0.5, 0.5],
 [0.1, 0.9]]

predictions = ['A', 'A and B', 'B']

Example