我看到Keras中的LSTM接受(batch_size,timesteps,data_dim)作为输入形状。但是我想知道是否有一种简单的方法可以将这些尺寸扩展到4个维度? 例如,如何将lstm应用于图像尺寸为64 x 64的移动MNIST数据集?
答案 0 :(得分:1)
您可以使用CNN模型提取图像的特征,然后再将其输入LSTM。
# define CNN model
cnn = Sequential()
cnn.add(Conv2D(...))
cnn.add(MaxPooling2D(...))
cnn.add(Flatten())
# define LSTM model
model = Sequential()
model.add(TimeDistributed(cnn, ...))
model.add(LSTM(..))
model.add(Dense(...))