不良的性能转移学习ResNet50

时间:2019-08-27 12:03:12

标签: python tensorflow keras deep-learning

我有一个11k张图像的数据集,用于语义分割。大约8.8k属于“第1组”,其余的属于“第2组”

我正在尝试模拟如果我们无法访问“第1组”图像但没有从中训练出的网络会发生什么情况。

所以我只在第1组训练了ResNet50。然后将该网络用作仅培训第二组的起点。

与使用第2组图像进行训练(每班平均准确率平均为3%)相比,结果实质上要好一些,但比起我刚开始使用imagenet权重时要少1%。我测试了resnet50的冻结块和一定的学习率。

第1组和第2组是同一问题域的一部分,但有些不同。它们是在不同的区域拍摄的(实际上整个场景覆盖了一堆区域,但第1组和第2组在这方面是不相交的)和不同的相机/分辨率。尽管此固定大小更接近组1的平均大小,但它们的大小已调整为固定大小。

它们与imagenet图像非常不同。它们是单色,矩形,本质上是我要细分的一种对象。

我并不是想立即获得与对所有图像进行训练相同的结果,但是肯定要比从imagenet进行训练有一定的难度。

1 个答案:

答案 0 :(得分:0)

我已经阅读了几篇关于同一主题的文章-我从3个类中获得了12k jpeg图像,并且在3个纪元后,准确度降为0。我正在等待交付新的图形卡以提高性能(目前正在使用90张-每个纪元120分钟),希望能提供更多反馈。我只是想知道该模型是为ImageNet设计的,其21k类的面孔是否可能是问题的一部分-它的宽度和深度太深,因此对权重的更改过于敏感....会对其他人感兴趣观看次数