我正在尝试训练一个神经网络,以了解如何与多个类别的人(人)一起检测纸箱。
虽然很容易检测到人并正确对其进行分类,但要检测到纸板箱却非常困难。
盒子看起来像这样:
我的怀疑是盒子太简单了,神经网络很难检测到它,因为要提取的特征太少了。
数据集的划分如下:
personA: 1160
personB: 1651
personC: 2136
person: 1959
box: 2798
人员佩戴不同的安全物品,根据这些物品的分类,不仅被检测为整个人,而且被识别为整个人。
我尝试使用以下架构:
ssd300_incetpionv2
ssd512_inceptionv2
faster_rcnn_inceptionv2
所有这些对人的检测和分类要比盒子好得多。我无法提供确切的mAP
(没有)。
我使用了张量流模型动物园的相关CoCo模型。
有什么想法为什么很难发现箱子?
谢谢。
PS:我在data science stack exchange上问了这个问题,但没有得到相关的答案。
答案 0 :(得分:1)
您从在COCO上进行过预训练的模型开始,该模型本身包括“人员”类别,但不包括“盒子”类别,因此对我来说,盒子类别更难。
我认为您的假设不正确,因为CNN不仅应能够提取简单对象以及复杂对象的正确特征。