我正在努力理解以下Keras片段实现的架构:
HIDDEN_DIM=256
VOCAB_SIZE=80
model = Sequential()
model.add(LSTM(units=HIDDEN_DIM, input_shape=(None, VOCAB_SIZE), return_sequences=True))
for i in range(LAYER_NUM - 1):
model.add(LSTM(units=HIDDEN_DIM, return_sequences=True))
model.add(TimeDistributed(Dense(VOCAB_SIZE)))
model.add(Activation('softmax'))
model.compile(loss="categorical_crossentropy", optimizer="rmsprop")
具体来说,我并非真正理解"单位"参数。 unit参数是否定义了时间步数,或者是否为每个时间步长定义了LSTM的数量(即" channel"的数量)?
答案 0 :(得分:0)
Units参数定义LSTM中隐藏单元的数量。时间步数将由句子中的单词数定义。