我想在Python中构建一个NLP文本分类器,该文本分类器将文本分为三个类别(A,B或C)之一。与B或C相比,分类器正确分类A更为重要。 例如:如果我给类别的权重为10、1、1,那么获得A的正确性比B或C的重要性高10倍。
predict_proba
函数获得置信度分数。运行一个宏,说如果置信度<70%(任意),则只需将其重新分类为B或C即可避免对A进行错误分类。(出于多种原因,我不喜欢这样做+理想情况下,我希望predict_proba
概率本身反映出我的分类偏见。)有人可以指出我要解决此问题的功能,还是提出建议?