在cnn之后连接循环层,tf.expand_dims有什么作用?

时间:2019-04-15 09:19:25

标签: python tensorflow keras conv-neural-network recurrent-neural-network

我想使用一个模型对八类图像进行分类。我认为在循环层之前使用卷积层可以解决我的问题。但是,在卷积层或密集层之后立即使用递归层会导致张量流产生以下错误。

Input 0 is incompatible with layer simple_rnn_1: expected ndim=3, found ndim=2

我通过在Lambda层内部使用Tensorflow expand_dims()函数解决了这个问题。看来工作正常,但我想确定我的模型工作正常。尽管查看了相关文档,但我仍无法理解expand_dims()为使模型起作用而做了什么。

from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Dropout, Flatten, Dense, Lambda, SimpleRNN
from tensorflow import expand_dims

def create_model():
    model = Sequential()
    model.add(Conv2D(32, (3, 3), input_shape=(50, 50, 1), padding='same',
                     activation='relu'))
    model.add(Conv2D(32, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Conv2D(64, (3, 3), padding='same', activation='relu'))
    model.add(Conv2D(64, (3, 3), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))

    model.add(Flatten())
    model.add(Lambda(lambda x: expand_dims(model.output, axis=-1)))
    model.add(SimpleRNN(64, return_sequences=False))

    model.add(Dense(units=8, activation='softmax'))

    model.compile(optimizer='adam', loss='categorical_crossentropy',
                  metrics=['accuracy'])

    return model

我想使用循环层(LSTM,GRU,其他循环模型)将CNN输出解释为顺序信息。我在expand_dims()上使用Lambda层做得对吗?

1 个答案:

答案 0 :(得分:1)

“展平”层将图像的尺寸减小为(批处理长度,特征尺寸),并且递归神经网络期望输入的尺寸为3而不是2,因为它需要时间输入的新尺寸,如(批量长度,时间维度,要素维度)

expand_dims只需添加一个额外的尺寸,即可将展平的输出转换为(批量长度,特征尺寸,1)。这意味着RNN现在可以工作了,它将把要素维视为数据的时间维,从而以有序的方式将它们扔出去,并按照您的意图进行操作。