Question

我正在尝试将我的卷积神经网络基于以下教程：

https://github.com/torch/tutorials/tree/master/2_supervised

问题是我的图像尺寸与教程中使用的尺寸不同。（3x200x200）。我也只有两节课。

以下是我所做的更改：

更改要在1_data.lua中加载的数据集。

nfeats = 3
width = 200
height = 200
ninputs = nfeats*width*height

和

nclass,noutputs

in 3_loss.lua和4_train.lua。

我的模型与教程中训练的模型相同。为方便起见，我将把代码放在下面：

  model = nn.Sequential()

  -- stage 1 : filter bank -> squashing -> L2 pooling -> normalization
  model:add(nn.SpatialConvolutionMM(nfeats, nstates[1], filtsize, filtsize))
  model:add(nn.Tanh())
  model:add(nn.SpatialLPPooling(nstates[1],2,poolsize,poolsize,poolsize,poolsize))
  model:add(nn.SpatialSubtractiveNormalization(nstates[1], normkernel))

  -- stage 2 : filter bank -> squashing -> L2 pooling -> normalization
  model:add(nn.SpatialConvolutionMM(nstates[1], nstates[2], filtsize, filtsize))
  model:add(nn.Tanh())
  model:add(nn.SpatialLPPooling(nstates[2],2,poolsize,poolsize,poolsize,poolsize))
  model:add(nn.SpatialSubtractiveNormalization(nstates[2], normkernel))

  -- stage 3 : standard 2-layer neural network
  model:add(nn.Reshape(nstates[2]*filtsize*filtsize))
  model:add(nn.Linear(nstates[2]*filtsize*filtsize, nstates[3]))
  model:add(nn.Tanh())
  model:add(nn.Linear(nstates[3], noutputs))

运行doall.lua文件时出现以下错误：

 ==> online epoch # 1 [batchSize = 1]   
 /home/torch/install/share/lua/5.1/torch/Tensor.lua:462: Wrong size for view. Input size: 64x47x47. Output size: 64x1600
 stack traceback:
 [C]: in function 'error'
 /home/torch/install/share/lua/5.1/torch/Tensor.lua:462: in function 'view'
 /home/torch/install/share/lua/5.1/nn/Reshape.lua:49: in function 'updateOutput'
 /home/torch/install/share/lua/5.1/nn/Sequential.lua:29: in function 'forward'
 4_train.lua:160: in function 'opfunc'
 /home/torch/install/share/lua/5.1/optim/sgd.lua:43: in function 'optimMethod'
 4_train.lua:184: in function 'train'
 doall.lua:77: in main chunk
 [C]: in function 'dofile'
 [string "_RESULT={dofile('doall.lua' )}"]:1: in main chunk
 [C]: in function 'xpcall'
 /home/torch/install/share/lua/5.1/trepl/init.lua:630: in function 'repl'
 .../torch/install/lib/luarocks/rocks/trepl/scm-1/bin/th:185: in main chunk
 [C]: at 0x00406670

我已经被困在这一天超过一天了。请帮忙。

Answer 1

问题是本教程中的卷积神经网络已经使用了32x32像素的固定大小输入分辨率。

在2个卷积/合并图层之后，您将获得64个具有5x5分辨率的要素图。这为以下完全连接的层提供了64x5x5 = 1,600个元素的输入。

正如您在教程中看到的那样，有一个专门的重塑操作，它将3D输入张量转换为具有1,600个元素的1D张量：

-- nstates[2]*filtsize*filtsize = 64x5x5 = 1,600
model:add(nn.Reshape(nstates[2]*filtsize*filtsize))

当您使用更高分辨率的输入时，您可以生成更高分辨率的输出要素贴图，此处200x200像素输入可提供64个大小为47x47的输出要素贴图。这就是您获得此错误尺寸错误的原因。

因此，您需要相应地调整重塑和跟随线性层：

model:add(nn.Reshape(nstates[2]*47*47))
model:add(nn.Linear(nstates[2]*47*47, nstates[3]))

火炬中的卷积神经网络。训练网络时出错

1 个答案: