更快的R-CNN是否使用滑动窗口来提出区域?

时间:2017-04-21 23:55:13

标签: machine-learning neural-network computer-vision deep-learning conv-neural-network

我已经阅读了paper呈现更快的R-CNN,但我不确定区域提案是否由滑动窗口完成。

使我认为它确实是一个正常的滑动窗口的部分是这个数字:Figure 3

如果是的话,这不是一个糟糕的方法吗?

1 个答案:

答案 0 :(得分:1)

嗯,这个数字确实是一个滑动窗口。但是有一个问题,这个滑动窗口实际上是作为卷积实现的,因此它可以有效地实现,因为卷积是一种高度优化的操作(并且网络的其余部分具有许多卷积层)。

所以它本身并不坏。生成提案的要素图的大小约为7x7(取决于使用的网络),但通道数量非常大。这可能是一个更大的性能问题。