Keras ValueError:没有为任何变量提供渐变

时间:2020-06-29 15:33:35

标签: python tensorflow machine-learning keras deep-learning

我已经阅读了相关主题,但是无法解决我的问题。

我目前正在尝试运行我的模型以便对5000个不同的事件进行分类,这些事件目前都属于同一类别(因此我的“标签”数据集由5000个1s组成)。

我对标签数据集使用一种热编码:

labels = np.loadtxt("/content/drive/My Drive/5000labels1.csv")

from keras.utils import to_categorical
labels=to_categorical(labels) # convert labels to one-hot encoding

然后我像这样定义我的模型:

inputs = keras.Input(shape=(29,29,1))

x=inputs

x = keras.layers.Conv2D(16, kernel_size=(3,3), name='Conv_1')(x)
x = keras.layers.LeakyReLU(0.1)(x)      
x = keras.layers.MaxPool2D((2,2), name='MaxPool_1')(x)

x = keras.layers.Conv2D(16, kernel_size=(3,3), name='Conv_2')(x)
x = keras.layers.LeakyReLU(0.1)(x)
x = keras.layers.MaxPool2D((2,2), name='MaxPool_2')(x)

x = keras.layers.Conv2D(32, kernel_size=(3,3), name='Conv_3')(x)
x = keras.layers.LeakyReLU(0.1)(x)
x = keras.layers.MaxPool2D((2,2), name='MaxPool_3')(x)
x = keras.layers.Flatten(name='Flatten')(x)

x = keras.layers.Dense(64, name='Dense_1')(x)
x = keras.layers.ReLU(name='ReLU_dense_1')(x)
x = keras.layers.Dense(64, name='Dense_2')(x)
x = keras.layers.ReLU(name='ReLU_dense_2')(x)

outputs = keras.layers.Dense(4, activation='softmax', name='Output')(x)

model = keras.Model(inputs=inputs, outputs=outputs, name='VGGlike_CNN')
model.summary()

keras.utils.plot_model(model, show_shapes=True)

OPTIMIZER = tf.keras.optimizers.Adam(learning_rate=LR_ST)

model.compile(optimizer=OPTIMIZER,
              loss='categorical_crossentropy',
              metrics=['accuracy'],
              run_eagerly=False)

def lr_decay(epoch):
  if epoch < 10:
    return LR_ST
  else:
    return LR_ST * tf.math.exp(0.2 * (10 - epoch))

lr_scheduler = keras.callbacks.LearningRateScheduler(lr_decay)


model_checkpoint = keras.callbacks.ModelCheckpoint(
        filepath='mycnn_best',
        monitor='val_accuracy',
        save_weights_only=True, 
        save_best_only=True,
        save_freq='epoch')

callbacks = [ lr_scheduler, model_checkpoint ]    

print('X_train.shape = ',X_train.shape)

history = model.fit(X_train, epochs=50,
                    validation_data=X_test, shuffle=True, verbose=1,
                    callbacks=callbacks)

我收到错误消息:“没有为任何变量提供渐变:['Conv_1_2 / kernel:0','Conv_1_2 / bias:0','Conv_2_2 / kernel:0','Conv_2_2 / bias:0',' Conv_3_2 / kernel:0','Conv_3_2 / bias:0','Dense_1_2 / kernel:0','Dense_1_2 / bias:0','Dense_2_2 / kernel:0','Dense_2_2 / bias:0','Output_2 / kernel:0','Output_2 / bias:0']。“

从我读到的内容来看,这似乎最有可能是由于损失函数的问题-但我不明白问题可能是什么。最终,我希望网络将事件分类为4个类别之一,因此我使用分类交叉熵来获取与事件数量的每个值相关的概率。

有人可以帮助我吗?如果需要,我可以提供指向原始代码的google colab文件的链接。

谢谢!

1 个答案:

答案 0 :(得分:1)

您错过了目标

@Service, @Component