Question

我正在对方言文本进行分类。问题是一些推文，可以分为方言A和B，该怎么办？我要先做，然后自动计算精度，我不想手动做。当我不将它们同时分类为A和B时，它给了我许多错误分类的文本。

尽管在培训中，它们没有被同时归为方言A和B。

Answer 1

使用OneHotEncoding

from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder

# Your target will look similar to
target = ['A', 'A', 'B']

# After OneHotEncoding
[[1, 0],
 [1, 0],
 [0, 1]]

在完成此目标的训练之后，您的模型将预测上课的可能性。您可以设置阈值以将预测分类为两个类

# Sample output
[[1., 0.],
 [0.5, 0.5],
 [0.1, 0.9]]

predictions = ['A', 'A and B', 'B']

Example

如何在文本分类中具有多输出？

1 个答案: