我正在使用ResNet50进行转移学习以识别小吃包。
它们的主要颜色和形状彼此相似。就像下面的图片一样。
我有大约33个要识别的项目。
我将FasterRCNN和SSD用于ResNet50。
做得不好,很多物品彼此混淆。
哪种深度学习架构适合识别此类对象?
或者有什么特殊的技巧可以更好地识别此类物体?
我认为我们需要具有识别细节模式的体系结构。
答案 0 :(得分:1)
请确保您要在caffe中链接原始的经过预先培训的网络,否则您将从网络培训开始!
如果您希望增加数据集的大小,经常会拍摄相同的图像集并旋转每幅图像几次。
绝对减小图像尺寸,并考虑减少与背景(人,背景可变等)一起使用的图像
过去,我曾将Alexnet用于功能差异较小的类似问题。
祝你好运!