NLP中的加权分类类别

时间:2019-06-18 17:28:34

标签: python nlp classification

我想在Python中构建一个NLP文本分类器,该文本分类器将文本分为三个类别(A,B或C)之一。与B或C相比,分类器正确分类A更为重要。 例如:如果我给类别的权重为10、1、1,那么获得A的正确性比B或C的重要性高10倍。

  • 想法:使用sklearns predict_proba函数获得置信度分数。运行一个宏,说如果置信度<70%(任意),则只需将其重新分类为B或C即可避免对A进行错误分类。(出于多种原因,我不喜欢这样做+理想情况下,我希望predict_proba概率本身反映出我的分类偏见。)

有人可以指出我要解决此问题的功能,还是提出建议?

0 个答案:

没有答案