应用错误收集

神经网络输出中的边界框估计

时间：2016-05-04 11:24:32

标签： machine-learning neural-network conv-neural-network

我正在研究一个卷积神经网络来识别动物，车辆，树木等物体。其中一个检测类是汽车。当我将图像提供给网络时，它预测为自动。但我需要在对象周围绘制一个边界框。当我尝试滑动窗口时，我有很多边框，但我只需要一个。如何在神经网络预测后找出最合适的对象边界框？我们不需要一些方法来从大图像中本地化对象吗？这就是我想要的。

我的最终图层函数是一个逻辑回归函数，它只预测1或0.我不知道如何将该预测作为概率分数。如果我有每个盒子的概率分数，那么很容易找到最合适的盒子。请建议我找到相同的方法。提前致谢。欢迎所有答案。

INPUT, OUTPUT AND EXPECTED OUTPUT

1 个答案:

答案 0 :(得分：1)

目前尚不清楚输入图像中是否有单个对象或多个对象。您的示例显示了一个。

如果你有 ONE 对象，这里有一些选项需要考虑边界框：

保留最遥远的：保持距离所有边界框中心最远的顶部，底部，右侧，左侧边界。
保持平均值：例如采取所有顶部边界并保持其平均位置。对所有的底部，右侧和左侧边界重复相同的操作。
保持中位数：与平均值相同，但保留每个方向边界的中位数。
保持边框具有最大激活次数：您使用逻辑回归作为最后一步，找到进入该逻辑层的输入，并保留最大的边界框输入到物流层。