(烤宽面条)ValueError:输入维度不匹配

时间:2017-03-11 21:29:23

标签: python machine-learning deep-learning theano lasagne

当我运行我的代码时,出现以下消息时出现值错误:

ValueError: Input dimension mis-match. (input[0].shape[1] = 1, input[2].shape[1] = 20)
Apply node that caused the error: Elemwise{Composite{((i0 + i1) - i2)}}[(0, 0)](Dot22.0, InplaceDimShuffle{x,0}.0, InplaceDimShuffle{x,0}.0)
Toposort index: 18
Inputs types: [TensorType(float64, matrix), TensorType(float64, row), TensorType(float64, row)]
Inputs shapes: [(20, 1), (1, 1), (1, 20)]
Inputs strides: [(8, 8), (8, 8), (160, 8)]
Inputs values: ['not shown', array([[ 0.]]), 'not shown']
Outputs clients: [[Elemwise{Composite{((i0 * i1) / i2)}}(TensorConstant{(1, 1) of 2.0}, Elemwise{Composite{((i0 + i1) - i2)}}[(0, 0)].0, Elemwise{mul,no_inplace}.0), Elemwise{Sqr}[(0, 0)](Elemwise{Composite{((i0 + i1) - i2)}}[(0, 0)].0)]]

我的训练数据是一个条目矩阵,例如..

[ 815.257786    320.447   310.841]

我输入训练功能的批次的形状为(BATCH_SIZE,3)并输入 TensorType(float64,矩阵)

我的神经网络非常简单:

    self.inpt = T.dmatrix('inpt')
    self.out  = T.dvector('out')

    self.network_in = nnet.layers.InputLayer(shape=(BATCH_SIZE, 3), input_var=self.inpt)
    self.l0         = nnet.layers.DenseLayer(self.network_in, num_units=40,
                        nonlinearity=nnet.nonlinearities.rectify,
    )
    self.network    = nnet.layers.DenseLayer(self.l0, num_units=1,
                        nonlinearity=nnet.nonlinearities.linear
    )

我的损失功能是:

    pred = nnet.layers.get_output(self.network)
    loss = nnet.objectives.squared_error(pred, self.out)
    loss = loss.mean()

我有点困惑为什么我得到尺寸不匹配。我正在传递正确的输入和标签类型(根据我的符号变量),我的输入数据的形状对应于我给我的InputLayer的预期'shape'参数。我认为这是我如何指定批量大小的问题,因为当我使用批量大小为1时,我的网络可以毫无问题地进行训练,并且错误消息中的输入[2] .shape [1]值是我的批量大小。我对机器学习很陌生,任何帮助都会非常感激!

1 个答案:

答案 0 :(得分:0)

原来问题是我的标签具有错误的维度。

我的数据有形状:

x_train.shape == (batch_size, 3)
y_train.shape == (batch_size,)

我网的象征性输入是:

self.inpt = T.dmatrix('inpt')
self.out  = T.dvector('out')

我能够通过重塑 y_train 来解决我的问题。然后我将符号输出变量更改为矩阵以考虑这些变化。

y_train = np.reshape(y_train, y_train.shape + (1,))
# y_train.shape == (batch_size, 1)

self.out = T.dmatrix('out')