了解更快的rcnn

时间:2017-08-06 09:38:01

标签: machine-learning deep-learning detection

我试图了解快速(呃)RCNN,以下是我正在搜索的问题:

  1. 要训练,FastRcnn模型我们必须给出边界框 培训阶段的信息。
  2. 如果你必须提供接线盒信息,那么它的作用是什么 投资回报率层。
  3. 我们是否可以使用经过预先训练的模型,该模型仅针对分类进行培训,而不是 对象检测并将其用于快速(呃)RCNN'

1 个答案:

答案 0 :(得分:3)

你的答案:

1.-是的。

2.- ROI层用于从可变大小的图像生成固定大小的矢量。这是通过使用最大池来执行的,但是不是使用典型的n×n个单元,而是将图像划分为n×n个非重叠区域(其大小不同),并输出每个区域中的最大值。 ROI层还可以将输入空间中的边界框边缘化到特征空间。

3.-更快的R-CNN必须与预训练网络(通常在ImageNet上)一起使用,不能进行端到端训练。这可能在论文中有点隐藏,但作者确实提到他们使用来自预训练网络(VGG,ResNet,Inception等)的功能。