用于计算机视觉的CNN架构

时间:2019-07-16 06:39:40

标签: python tensorflow deep-learning computer-vision conv-neural-network

我正在尝试使用Tensorflow来实现此paper。作者使用的是VGG 16的修改版本。

  

...然后,我们在VGG16之后执行卷积和最大池化,将特征图的每一层数量减少一半。

但按如下所述对其进行修改:

  

请注意,我们删除了VGG16中的最后一个卷积组,仅产生了10个卷积层。

因此,他们将VGG16体系结构的最后6层(3个卷积层和3个完全连接的层)替换为两个卷积层,一个用于二进制分类,另一个用于边界框预测:

  然后,如图5所示,我们添加了两个卷积层分支。第一个分支执行二进制分类以预测成为车辆的可能性。第二个预测当前帧以及将来的n-1个帧的边界框。

问题在于,我现在花了很长时间才弄清楚如何实现这两层。我将不胜感激。

1 个答案:

答案 0 :(得分:0)

一些最流行的网络已经在python库中。 vgg-16是用python实现的,因此您可以将其导入脚本中,并使用预先训练的vgg权重或仅使用vgg结构,还可以使用网络的每个部分。因此,搜索包含流行网络(例如vgg)的python库。