我有一个分类问题,我希望预测结果,但希望我的分类器能够在答案中获得几次“尝试”(比如放置单向赌注),而不是单个分类,或者是正确或不正确,并且想知道最佳流程。
示例:鉴于结果A,B,C和D,我想预测它将是'A或B',或'A或C',以及'正确'解决方案(那些)至少包含正确的个别答案)相应地影响学习过程。
到目前为止,我的想法是将数据集分成多个或多或少如上(A或C)并以常规方式训练分类器,或者训练多个分类器以使它们多样化,以及简单地结合结果,但我想知道是否有更好/不同的方式?我确信这不是一个独特的问题,但我不确定Google的正确术语。
我不知道这是否是一个相关的问题,但是还有一种方法可以包含在“我不知道”的选项中 - 即。不进行分类?
答案 0 :(得分:1)
很多分类器可以做你想做的事
朴素贝叶斯可以为每个标签提供概率,因此您可以获取最可能的k个标签,而不仅仅是单个最可能的标签和输出。
Logistic回归,SVM还可以为每个标签提供一个分数,让您做类似的事情
另一个技巧是稍微干扰输入特征向量并将其提供给分类器。重复几次,你得到的不是一个输出标签,而是几个。您可以按频率对它们进行计数和排序,以获得多个可能的答案。然后,您可以制定一些截止标准,仅选择这些标签的子集并将其返回给用户。