使用深度学习标记跑道以进行定位和检测

时间:2017-06-29 11:37:42

标签: machine-learning tensorflow computer-vision deep-learning conv-neural-network

Sample Ariel view of Runway that needs to be localized**strong text**

上面显示的是需要本地化的跑道示例图像(跑道周围的边界框) 我知道如何在tensorflow中完成图像分类,我的问题是如何标记此图像进行培训?  我希望模型输出4个数字来绘制边界框。 在CS231n中,他们说我们使用分类器和本地化头。 但我的模型如何知道400x400图像中的移动通道在哪里?

简介如何 LABEL 此图片进行培训?因此,在训练之后,我的模型会检测并定位(在此跑道周围绘制边界框)来自输入图像的跑道。 请随时给我链接讲座,视频,github教程,从中我可以了解到这一点。 **********不是CS231n **********我已经参加了这个讲座,无法理解如何使用他们的方法来解决。 感谢

2 个答案:

答案 0 :(得分:1)

如果要预测边界框,则标签也是边界框。这是大多数物体检测系统用于训练的内容。您可以只有边界框标签,或者如果要检测多个对象类,则还需要每个边界框的类标签。

答案 1 :(得分:1)

从谷歌或任何仅包含跑道照片的资源中收集数据(从一些更近的​​视图)。我建议你使用预先训练好的图像分类网络(如VGG,Alexnet等),并使用下载的跑道数据微调这个网络。

在跑道数据集上构建好的图像分类器后,您可以使用任何流行的算法从图像生成提案区域。

现在将提案的所有区域逐一传递到分类网络并检查天气这个网络正在将提议的给定区域分类为正面或负面。如果它分类为肯定,那么很可能你的对象(跑道)存在于该区域。否则它不会。

如果根据分类器存在大量提案区域,那么您可以使用非最大抑制算法来减少正数提案的数量。