我遵循了一个教程来制作Keras LSTM模型,该模型具有80个时间步长,每个时间步长看80个单词,并且一次预测1个单词。现在,我正在使用功能性API来创建不同的LSTM模型,但不确定在没有时间分布层的情况下我的其他模型如何工作。我将在下面列出第一个LSTM模型。下一层如何在没有时间分布层的情况下在同一批中的不同时间点进行80个单独的预测?
model = keras.Sequential()
model.add(keras.layers.Embedding(15938, 150, input_length=80))
model.add(keras.layers.CuDNNLSTM(1024))
model.add( keras.layers.Dense(15938, activation='softmax') )
arrayOfArraysToTrainOnInputF = np.empty( [80, 80], dtype=int )
arrayOfArraysToTrainOnTargetF = np.empty( [80, 15938], dtype=int )
model.train_on_batch(
arrayOfArraysToTrainOnInputF,arrayOfArraysToTrainOnTargetF )
答案 0 :(得分:0)
我能够找到答案。嵌入操作使输入的大小为(80,80,150),表示80个时间步长的80个样本。