eesen-transcriber - 在词典中添加技术词汇

时间:2016-11-29 17:33:50

标签: speech-recognition speech-to-text transcription

我正在使用srvk/eesen-transcriber存储库来转录一些音频文件,我已经按照预期在Vagrant虚拟机上启动并运行了所有内容。

我希望能够使用Linux,Laravel或MySQL之类的单词转录非常技术性的录音,这些录音不能很好地转录。我如何(轻松地)将这些单词添加到转录软件中,以便在说出时成功识别它们?

更新

我试图按照Nikolay Shmyrev在这里找到的指示:

http://speechkitchen.org/kaldi-language-model-building/

我可以在向run_adapt.sh添加新词汇后成功运行newwords.txt脚本,但是当我尝试使用更新后的语言模型将音频文件转录为新词汇时,它无法识别新的词汇。

以下是我尝试遵循如何调整语言模型的说明的视频:

https://www.youtube.com/watch?edit=vd&v=-Zn9_y56R4c

1 个答案:

答案 0 :(得分:0)

您需要调整语言模型。文档在这里:

http://speechkitchen.org/kaldi-language-model-building/