我使用 keras 构建模型,并在 tensorflow 中编写优化代码和所有其他代码。当我使用非常简单的层,如密集或 Conv2D 时,一切都很简单。但是将 BatchNormalization 图层添加到我的keras模型中会使问题变得复杂。
由于 BatchNormalization 图层在训练阶段和测试阶段的表现不同,我发现我的 feed_dict中需要 K.learning_phase():True 。但是下面的代码效果不好。它运行时没有错误,但模型的性能没有任何改善。
import keras.backend as K
...
x_train, y_train = get_data()
sess.run(train_op, feed_dict={x:x_train, y:y_train, K.learning_phase():True})
当我尝试使用keras fit 功能训练keras模型时,效果很好。
如何在 tensorflow 中使用 BatchNormalization 图层训练 keras 模型?