在二元分类器中添加大量正例会有什么影响?

时间:2018-05-24 21:11:53

标签: machine-learning

假设我使用相同数量的 N个正例 N个反例训练了二元分类器。现在,我尝试添加另一个 N个正面例子进行培训。这会产生什么影响?

在标签类型方面有不成比例的训练样例会产生什么影响。

1 个答案:

答案 0 :(得分:0)

一般来说,这意味着您会将分类算法偏向正面的例子。因此,为了获得最佳结果,您的训练数据集中的正/负样本比例与验证数据集(以及您稍后将要生成的数据集)的比例相同非常重要。

然而,细节可能取决于您使用的算法类型,以及添加的阳性样本是否与已存在的阳性样本无关。