应用错误收集

我想在Python中构建一个NLP文本分类器，该文本分类器将文本分为三个类别（A，B或C）之一。与B或C相比，分类器正确分类A更为重要。例如：如果我给类别的权重为10、1、1，那么获得A的正确性比B或C的重要性高10倍。

想法：使用sklearns predict_proba函数获得置信度分数。运行一个宏，说如果置信度<70％（任意），则只需将其重新分类为B或C即可避免对A进行错误分类。（出于多种原因，我不喜欢这样做+理想情况下，我希望predict_proba概率本身反映出我的分类偏见。）

有人可以指出我要解决此问题的功能，还是提出建议？