python - 如何在张量流中使用CNN的特征进行物体检测？

时间：2016-05-06 13:41:52

标签： python computer-vision tensorflow deep-learning conv-neural-network

我正在尝试结束统一模型，以检测（本地化）图像中的对象。对象本身可以有多种类型，例如“野外文本”，但对象的周围特征应该确定感兴趣区域的位置。

喜欢检测人脸，而不考虑脸部本身的特征。那是脖子上的一些距离。

我期望输出是对象的坐标，或者像图像网格式一样生成边界框，如：[xmin，ymin，xmax，ymax] 我有500个图像的数据集。是否存在基于周围特征的张量流中的对象检测的任何示例。即来自conv1或conv2的特征映射。？

答案 0 :(得分：4)

您可以查看基于Tensorflow的对象检测/本地化框架： https://github.com/Russell91/TensorBox

尽管如此，我不确定500张图片是否足以成功重新训练所提供的模型。

答案 1 :(得分：1)

使用深度学习的对象检测大致分为一级检测器（Yolo，SSD）和两级检测器，如Faster RCNN。 Google的repo [1]包含针对各种检测体系结构的预训练模型。

您可以选择预先训练过的模型，然后在数据集上进行训练。两阶段模型是模块化的，您可以选择不同的特征提取器，具体取决于速度/准确度对您是否至关重要。