PyTorch 中的多层双向 LSTM/GRU 合并模式

时间:2021-01-08 11:32:12

标签: python pytorch lstm bidirectional

我正在尝试将我的代码从 Keras 复制到 PyTorch,以比较多层双向 LSTM/GRU 模型在 CPU 和 GPU 上的性能。我想研究不同的合并模式,例如“concat”(这是 PyTorch 中的默认模式)、sum、mul、average。合并模式定义了前向和后向的输出将如何传递到下一层。

在 Keras 中,这只是多层双向 LSTM/GRU 模型的合并模式的参数更改,PyTorch 中是否也存在类似的东西?一种选择是在每一层之后手动进行合并模式操作并传递到下一层,但我想研究性能,所以我想知道是否有其他有效的方法。

谢谢,

0 个答案:

没有答案