如何在张量流中使用CNN的特征进行物体检测?

时间:2016-05-06 13:41:52

标签: python computer-vision tensorflow deep-learning conv-neural-network

我正在尝试结束统一模型,以检测(本地化)图像中的对象。对象本身可以有多种类型,例如“野外文本”,但对象的周围特征应该确定感兴趣区域的位置。

喜欢检测人脸,而不考虑脸部本身的特征。那是脖子上的一些距离。

我期望输出是对象的坐标,或者像图像网格式一样生成边界框,如:[xmin,ymin,xmax,ymax] 我有500个图像的数据集。是否存在基于周围特征的张量流中的对象检测的任何示例。即来自conv1或conv2的特征映射。 ?

2 个答案:

答案 0 :(得分:4)

您可以查看基于Tensorflow的对象检测/本地化框架: https://github.com/Russell91/TensorBox

尽管如此,我不确定500张图片是否足以成功重新训练所提供的模型。

答案 1 :(得分:1)

使用深度学习的对象检测大致分为一级检测器(Yolo,SSD)和两级检测器,如Faster RCNN。 Google的repo [1]包含针对各种检测体系结构的预训练模型。

您可以选择预先训练过的模型,然后在数据集上进行训练。两阶段模型是模块化的,您可以选择不同的特征提取器,具体取决于速度/准确度对您是否至关重要。

[1] Google's object detection repository