我正在尝试使用分类器调试问题。问题在于它总是为给定的输入预测相同的类,尽管准确度接近80%。
我训练我的CNN来检测两个班级之间的差异。 A级有2575个jpegs,B级有665个jpegs。
这是否会导致我的CNN问题始终预测同一个类?这是每个班级中的项目之间的不平衡吗?一般来说,如果我使两个类的大小相同(665 jpegs?),我的表现会有所改善吗?
答案 0 :(得分:9)
问题似乎是类不平衡的情况,并且有不同的方法来处理它:
data augmentation
,这样就可以解决类不平衡问题以及解决过度拟合和改进泛化。