TensorFlow / Keras:输出层上的形状错误

时间:2018-12-08 02:24:39

标签: python tensorflow machine-learning keras neural-network

我已经在互联网上搜索了几天,试图找到解决该错误的方法,但是我发现没有什么特别适用:

ValueError: Error when checking target: expected dense_2 to have shape (300,) but got array with shape (60,)

以下是生成错误的代码(数据预处理除外):

model = keras.Sequential([
keras.layers.Conv1D(5,input_shape=(1,60), kernel_size=12, padding='same'), 
keras.layers.Conv1D(10, padding='same',activation=tf.nn.relu, kernel_size=10),
keras.layers.Conv1D(20, padding='same',activation=tf.nn.relu, kernel_size=6),
keras.layers.Conv1D(30, padding='same',activation=tf.nn.relu, kernel_size=5),
keras.layers.Flatten(),
keras.layers.Dense(70, activation="relu"),
keras.layers.Dense(300,activation="tanh")
])
model.compile(optimizer=tf.train.AdamOptimizer(0.001),
loss='mse',
metrics=['mae'])
model.fit(traindata,trainlabels, epochs=10, batch_size=int(len(traindata)/60))

我不确定是什么原因导致此错误,但我进行了一些故障排除,以尝试缩小可能性。

我试图做的第一件事就是尝试在TensorFlow网站上运行其中一个示例,我选择了位于here的MNIST时尚示例。

此程序运行没有错误,并且训练得很好,因此我认为TensorFlow或Python下载中没有错误。

然后,我尝试复制MNIST时尚示例中使用的模型,以测试它是否是我的模型中的错误。这是代码:

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(60,)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])
model.compile(optimizer=tf.train.AdamOptimizer(),
loss = 'sparse_categorical_cross_entropy',
metrics = ['accuracy']
)

我对模型所做的唯一更改是第一层的输入形状,以使它能够接收我的数据。但是错误仍然存​​在:

ValueError: Error when checking target: expected dense_1 to have shape (10,) but got array with shape (60,)

我最后尝试做的是建立自己的密集模型,该模型将吸收通过np.random.random创建的伪数据。

这是整个文件:

import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt

data = np.random.random((50,60))
datalabels = np.random.random((50,60))
model = keras.Sequential([
keras.layers.Dense(128,input_shape=(60,), activation="relu"),
keras.layers.Dense(50, activation="relu"),
keras.layers.Dense(10, activation="tanh")

])
model.compile(optimizer=tf.train.AdamOptimizer(),
loss="mae",
metrics=['mse'])

model.fit(data, datalabels, epochs=5, batch_size=10)

这也收到了错误,我对原因感到困惑,但是我认为这可能与我的伪数据的生成有关

ValueError: Error when checking target: expected dense_2 to have shape (10,) but got array with shape (60,)

如果有帮助,我将最后一个模型的所有图层及其输入和输出形状打印出来:

Layer: dense
    input_shape: (None, 60)
    output_shape: (None, 128)
Layer: dense_1
    input_shape: (None, 128)
    output_shape: (None, 50)
Layer: dense_2
    input_shape: (None, 50)
    output_shape: (None, 10)

这个错误让我最困惑的是,它仅在输出层出现错误。如果我在模型的末尾添加另一层,则该层将出错,除非输出层中的单位数等于模型输入的形状(例如:input_shape=(60,)的数目最后一层的单位等于60)。有谁知道为什么会这样?

1 个答案:

答案 0 :(得分:1)

使用model.summary(),您将看到每一层的输出形状。在您提供的第一个示例中,最后一层的输出形状(也是模型的输出形状)为(None, 300)。这意味着它将期望使用形状为(300,)的标签(即每个标签的形状)。但是,似乎您在调用fit时为模型提供的标签数组,即trainlabels的形状为(num_samples, 60)。而它必须与模型的输出形状一致,因此形状为(num_samples, 300)。同样的情况适用于您提到的所有其他失败示例。