我正在使用转换网对图像进行分类。多类问题(第12类)
我的训练集是3500张图像,不平衡类(例如A类= 1200张图像,B类= 50张图像)。我用班级重量来解决不平衡和数据扩充
编辑数据增强具有keras功能,只需旋转和翻转即可。我只会增加训练集
由于我班的某些人的数据非常少,所以我分别进行了60%的训练/ 20%的验证/ 20%的测试集(即,对于B类,我获得了30个训练数据/ 10个验证数据/ 10个测试数据)>
然后我进行了不同的划分,每次都有不同的训练/验证和测试数据 结果是稳定的=>我的指标(微F1分数)在不同的拆分下并没有太大变化,并且混淆矩阵向我显示了没有班级效应:不同的拆分并不意味着给定班级的不同结果
现在,我将模型应用于没有标签的集合。约1万张图片。 结果非常差:当我在测试集上获得B类的准确度分数为60%时,对于没有标签的那套,我的准确度约为5%
我的问题:
可能会过拟合吗?当我停止训练模型时,训练损失= 0.3 /训练F1 = 95%。验证损失= 0.7 /验证F1 = 80% 我不这样认为,因为验证损失不会增加(我会在模型增加之前就停止它)
我该如何调查才能理解为什么我的结果在包含10000个数据的新数据集上如此差(当我说我的结果时,我谈到的是精度,因为这是我可以轻松计算出的某些类的唯一指标)< / p>
答案 0 :(得分:1)
您的模型可能是过度拟合的,因为您的模型正在学习少量的B类增强图像。增强会产生更多的数据,但本质上图像的内容保持不变。如果新的未标记B类图像与训练图像相似,那么您应该没有此问题,但是如果它们不同,那么您将有此问题。也可以在增强图像上训练模型,但仅在原始图像上进行验证,以防止过度拟合并帮助模型更好地泛化。看看这个link。
您可以尝试的另一件事是从其他类别中抽取少量样本,然后在不进行扩充的情况下训练新模型,然后测试图像。这将使您澄清模型是否适合增强数据。
如果仅在Keras中进行基本增强,则还可以尝试使用GAN等先进的增强技术。如有可能,请使用扩充步骤更新您的问题。