确定文本不属于任何类别

时间:2019-05-28 15:24:45

标签: python machine-learning classification text-classification

我正在尝试使文本分类器在FAQ聊天机器人中使用。

假装我有两个班级:pricingcontacts。 在测试“ 您在哪里”之类的常用短语或分类器正常工作时。但是,如果我输入“ 测试哦,我的上帝测试即将来临”或仅仅是“ jgnerlgnwel ergne ”,它只会给我0.5 / 0.5的分数,分数总和为1。 >

我试图确定置信度阈值,例如0.7,但有时随机短语的得分要高于真实短语的得分。我的训练数据非常薄弱,但是仍然应该确定字符串只是一组随机字符还是文本不正确?

我尝试将sklrean的SVC和KNN分类器与不同的参数集结合使用。但是我希望我的分类器可以像这样工作:

输入:哦,天哪,分类器还活着吗?

分类器的分数:([['pricing','contacts'],[0.01343,0.075457])分数之和不等于1。

0 个答案:

没有答案