如何在pytorch中实现金字塔双向LSTM(pBLSTM)

时间:2018-05-29 17:46:49

标签: python tensorflow lstm pytorch bidirectional

我需要使用相当长的序列(数百到数千个时间步长),我从Listen, attend and spell: A neural network for large vocabulary conversational speech recognition找到了金字塔双向LSTM。它读取

  

Listen操作使用具有金字塔结构的双向长短期记忆RNN(BLSTM)[15,16,2]。需要这种修改以从输入x的长度T减小h的长度U,因为输入语音信号可以是数百到数千帧长。 BLSTM直接应用于操作Listen缓慢收敛并产生的结果低于此处报告的结果,即使经过一个月的训练时间。这可能是因为AttendAndSpell操作很难从大量输入时间步中提取相关信息。

但我无法找到实现。有人知道pBLSTM的实现,最好是在pytorch中,但tensorflow也可以。

这种结构让我想起序列上的卷积很多。

1 个答案:

答案 0 :(得分:1)

以下是"Listen,attend and spell"

的实施