标签: neural-network conv-neural-network object-detection faster-rcnn
我尝试了解锚点框如何协调从要素地图生成的内容,并且对此过程有一些疑问。
1-)从上方图像中,特征图的大小为N x M x C,并将滑动窗口选择为3x3。这个3x3窗口的任务是什么?我认为,它习惯于将尺寸从NxMxC减小到NxMx1?我对吗?如果不是,此窗口的任务是什么?
2-)要从特征图获取RGB输入图像上的锚框坐标,3x3窗口如何影响此坐标?
谢谢。