初学者在这里学习机器!就像了解我应该如何处理分类问题一样。鉴于手头的问题是分类对象是属于A类还是B类,我想知道我是应该使用生成模型还是歧视模型。我有两个问题。
- 判别模型似乎在分类问题上做得更好,因为它纯粹关注决策边界是如何绘制的,而不是其他任何东西。
醇>
问:但是,如果使用大约80个A类对象和少于10个B类对象进行训练和测试的小型数据集,那么判别模型过度拟合以及因此生成模型会表现得更好吗?
- 此外,由于A类对象和B类对象的数量存在巨大差异,所训练的模型很可能只能获得A类对象。即使模型将所有对象分类为A类,这仍然会导致非常高的准确度分数。
醇>
问:关于如何减少这种偏见的任何想法,因为没有其他方法可以增加B类数据集的大小?