我试图在Keras中构建一个卷积自动编码器。我的印象是卷积层与输入具有相同的输出维度,除非你设置步幅> 1或设置border_mode ='有效'。这是我的网络
from keras.layers import Convolution2D, MaxPooling2D, UpSampling2D, Activation
from keras.models import Model, Sequential
model = Sequential()
model.add(Convolution2D(16, 3, 3, border_mode='same', input_shape=(1, 1920, 1080)))
model.add(Activation('relu'))
model.add(MaxPooling2D((2, 2), border_mode='same'))
model.add(Convolution2D(8, 3, 3, border_mode='same'))
model.add(Activation('relu'))
model.add(UpSampling2D((2, 2)))
model.add(Convolution2D(8, 3, 3, border_mode='same'))
model.add(Activation('relu'))
model.add(UpSampling2D((2, 2)))
model.compile(optimizer='adadelta', loss='binary_crossentropy')
当我检查第一层的输出尺寸时,似乎y坐标的长度已减小。
>>>model.layers[0].output_shape
(None, 1, 1920, 16)
造成这种情况的原因是什么?我无法弄清楚16来自哪里。它似乎与1080没有任何简单的关系。
答案 0 :(得分:1)
问题在于所谓的image_ordering
。根据您使用的后端 - 您需要以指定的格式提供数据:
对于th
(Theano)图片排序,您应该提供以下格式的数据:
[batches, channels, image_width, image_weight]
这是您认为正确的格式。
tf
(TensorFlow)图像排序为:
[batches, width, height, channels]
这是您的Keras安装解释输入的格式。
keras中的默认图像排序是tf
,我假设这会导致您的问题。您可以通过以下命令检查图像排序:
from keras.backend import image_dim_ordering
print image_dim_ordering() # Assuming that you're using a Python 2.*
您可以通过更改keras.json
所描述的here来更改它。
您还可以通过打印model.summary()
的结果来检查您的模型详细信息,以确保实际情况如此。