在page上,为什么lstm层具有131584参数? 每个句子的最大字数为500,嵌入的字数为128。
答案 0 :(得分:1)
LSTM的参数数量,采用大小为m的输入向量 并给出大小为n
的输出向量是:
4(nm + n ^ 2)
使用偏差矢量,该数字变为:
4(nm + n ^ 2 + n)
131584 = 4 *(128 * 128 + 128 ^ 2 + 128)
更多:https://datascience.stackexchange.com/questions/10615/number-of-parameters-in-an-lstm-model