如何在chainer中使用NStepLSTM或BiNStepLSTM?

时间:2017-08-23 09:15:29

标签: chainer

如何使用NStepLSTM或BiNStepLSTM? 我看到引用它必须提供参数作为变量列表,这个列表是什么?

如何使用它来复合其他层Link ??

1 个答案:

答案 0 :(得分:1)

NStepLSTM假设输入是可能具有不同长度的序列的小批量。输入是这些序列的列表。每个序列由形状(T, D)的变量表示,其中T是序列的长度,D是序列中每个项目的维度(如果您正在处理文本数据) ,D可以是嵌入层的维度。)

然后,NStepLSTM.__call__以与输入序列(变量列表)类似的格式返回三个元组:最终隐藏状态,最终单元状态和输出序列。您可以将其与其他功能或链接结合使用。例如,您可以将输出序列中的每个变量传递给某个损失函数以获得损失。