我正在对方言文本进行分类。问题是一些推文,可以分为方言A和B,该怎么办?我要先做,然后自动计算精度,我不想手动做。当我不将它们同时分类为A和B时,它给了我许多错误分类的文本。
尽管在培训中,它们没有被同时归为方言A和B。
答案 0 :(得分:1)
使用OneHotEncoding
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder
# Your target will look similar to
target = ['A', 'A', 'B']
# After OneHotEncoding
[[1, 0],
[1, 0],
[0, 1]]
在完成此目标的训练之后,您的模型将预测上课的可能性。您可以设置阈值以将预测分类为两个类
# Sample output
[[1., 0.],
[0.5, 0.5],
[0.1, 0.9]]
predictions = ['A', 'A and B', 'B']