标签: machine-learning
假设我使用相同数量的 N个正例和 N个反例训练了二元分类器。现在,我尝试添加另一个 N个正面例子进行培训。这会产生什么影响?
在标签类型方面有不成比例的训练样例会产生什么影响。
答案 0 :(得分:0)
一般来说,这意味着您会将分类算法偏向正面的例子。因此,为了获得最佳结果,您的训练数据集中的正/负样本比例与验证数据集(以及您稍后将要生成的数据集)的比例相同非常重要。
然而,细节可能取决于您使用的算法类型,以及添加的阳性样本是否与已存在的阳性样本无关。