深层网络如何接受物体检测中不同尺度的图像?

时间:2017-06-11 09:27:15

标签: matlab deep-learning object-detection matconvnet

使用MatConvNet构建的网络接受不同比例的图像并对其进行评估。例如: -

%img is an image of size 730*860*3
%net is loaded DagNN obj
scales = [-2 -1 0 0.5 1]
for s = 2.^scales
    img = imresize(raw_img, s, 'bilinear');
    img = bsxfun(@minus, img, averageImage);
    inputs = {'data', img};
    net.eval(inputs);
end

在调试时,我发现img已调整大小并评估循环的每次迭代。但网络(net)应该接受固定图像。作为 -

K>> net

net = 

  DagNN with properties:

                 layers: [1x319 struct]
                   vars: [1x323 struct]
                 params: [1x381 struct]
                   meta: [1x1 struct]
                      m: []
                      v: []
                   mode: 'test'
                 holdOn: 0
    accumulateParamDers: 0
         conserveMemory: 1
        parameterServer: []
                 device: 'cpu'

加载经过训练的网络后: -

K>> net.vars(1, 1).value

ans =

     []

for循环内:-( iter 1)

K>> net.vars(1, 1).value

ans =

     [64 64 3]

(iter 2)

K>> net.vars(1, 1).value

ans =

     [160 160 3]

等...... 那么DagNN如何处理这样的输入并进行自我评估?(我是MatConvNet的新手,无法在文档中找到任何帮助。所以请回答这个问题并建议如何在keras中构建这样的东西)

1 个答案:

答案 0 :(得分:0)

通常,ConvNet不关心图像的输入大小。所有层都在执行类似卷积的操作(例如,甚至池在空间上表现得像卷积)。如果提供大输入,则会获得大输出。唯一关心输入大小的是损失层。如果您没有丢失图层,则代码根本不会中断。在MatConvNet中没有完全连接层这样的东西,一切都是卷积的。

顺便说一下,这就是为什么早期工作ConvNet的人认为FCN是一个有趣的名字,因为完全连接的层和卷积层之间确实没有区别。