我试图了解快速(呃)RCNN,以下是我正在搜索的问题:
答案 0 :(得分:3)
你的答案:
1.-是的。
2.- ROI层用于从可变大小的图像生成固定大小的矢量。这是通过使用最大池来执行的,但是不是使用典型的n×n个单元,而是将图像划分为n×n个非重叠区域(其大小不同),并输出每个区域中的最大值。 ROI层还可以将输入空间中的边界框边缘化到特征空间。
3.-更快的R-CNN必须与预训练网络(通常在ImageNet上)一起使用,不能进行端到端训练。这可能在论文中有点隐藏,但作者确实提到他们使用来自预训练网络(VGG,ResNet,Inception等)的功能。