具有lstm和ctc的自动语音识别

时间:2018-07-10 18:08:14

标签: python-3.x tensorflow speech-recognition lstm

我在训练具有ctc损失的lstm网络以进行自动语音识别时遇到一些常见问题。

1)我的输入是mfcc,目标是一系列电话,这些电话是我的课程(请参阅timit语音设置)->所以我得到了一个分类问题的顺序。我进行了大约1000000个培训示例的小批量培训。我在每台16 GB Ram的tesla V100上运行脚本。

  • 您在训练时使用大量数据运行此类模型方面是否有经验?
  • 对于ctc丢失,我可以怎么做以加快培训速度?

0 个答案:

没有答案