我正在尝试结束统一模型,以检测(本地化)图像中的对象。对象本身可以有多种类型,例如“野外文本”,但对象的周围特征应该确定感兴趣区域的位置。
喜欢检测人脸,而不考虑脸部本身的特征。那是脖子上的一些距离。
我期望输出是对象的坐标,或者像图像网格式一样生成边界框,如:[xmin,ymin,xmax,ymax] 我有500个图像的数据集。是否存在基于周围特征的张量流中的对象检测的任何示例。即来自conv1或conv2的特征映射。 ?
答案 0 :(得分:4)
您可以查看基于Tensorflow的对象检测/本地化框架: https://github.com/Russell91/TensorBox
尽管如此,我不确定500张图片是否足以成功重新训练所提供的模型。
答案 1 :(得分:1)
使用深度学习的对象检测大致分为一级检测器(Yolo,SSD)和两级检测器,如Faster RCNN。 Google的repo [1]包含针对各种检测体系结构的预训练模型。
您可以选择预先训练过的模型,然后在数据集上进行训练。两阶段模型是模块化的,您可以选择不同的特征提取器,具体取决于速度/准确度对您是否至关重要。