应用错误收集

我正在尝试使文本分类器在FAQ聊天机器人中使用。

假装我有两个班级：pricing和contacts。在测试“ 您在哪里”之类的常用短语或分类器正常工作时。但是，如果我输入“ 测试哦，我的上帝测试即将来临”或仅仅是“ jgnerlgnwel ergne ”，它只会给我0.5 / 0.5的分数，分数总和为1。 >

我试图确定置信度阈值，例如0.7，但有时随机短语的得分要高于真实短语的得分。我的训练数据非常薄弱，但是仍然应该确定字符串只是一组随机字符还是文本不正确？

我尝试将sklrean的SVC和KNN分类器与不同的参数集结合使用。但是我希望我的分类器可以像这样工作：

输入：哦，天哪，分类器还活着吗？

分类器的分数：（[['pricing'，'contacts']，[0.01343，0.075457]）分数之和不等于1。