神经网络输出中的边界框估计

时间:2016-05-04 11:24:32

标签: machine-learning neural-network conv-neural-network

我正在研究一个卷积神经网络来识别动物,车辆,树木等物体。其中一个检测类是汽车。当我将图像提供给网络时,它预测为自动。但我需要在对象周围绘制一个边界框。当我尝试滑动窗口时,我有很多边框,但我只需要一个。如何在神经网络预测后找出最合适的对象边界框?我们不需要一些方法来从大图像中本地化对象吗?这就是我想要的。

我的最终图层函数是一个逻辑回归函数,它只预测1或0.我不知道如何将该预测作为概率分数。如果我有每个盒子的概率分数,那么很容易找到最合适的盒子。请建议我找到相同的方法。提前致谢。欢迎所有答案。

INPUT, OUTPUT AND EXPECTED OUTPUT

1 个答案:

答案 0 :(得分:1)

目前尚不清楚输入图像中是否有单个对象或多个对象。您的示例显示了一个。

如果你有 ONE 对象,这里有一些选项需要考虑边界框:

  • 保留最遥远的:保持距离所有边界框中心最远的顶部,底部,右侧,左侧边界。
  • 保持平均值:例如采取所有顶部边界并保持其平均位置。对所有的底部,右侧和左侧边界重复相同的操作。
  • 保持中位数:与平均值相同,但保留每个方向边界的中位数。
  • 保持边框具有最大激活次数:您使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并保留最大的边界框输入到物流层。