我已经查看了类似问题的答案,但我仍然对为什么LSTM的输入维度确实是[batch_size,number_hidden_units]感到困惑。
数据本身,格式为[batch_size,number_of_features]。
我们希望LSTM的输出具有维度[batch_size,number_hidden_units]。
为简单起见,让我们忽略LSTM门播放的工作。然后,似乎LSTM只需要通过将其与大小为[number_features,number_hidden_units]的权重矩阵相乘来对输入向量进行编码。
为什么不能这样做,因此输入是任何维度?我在俯瞰什么?
编辑:我刚刚意识到TF文档说输入确实是[batch_size,number_features]。我曾在其他地方读过。