我正在使用srvk/eesen-transcriber存储库来转录一些音频文件,我已经按照预期在Vagrant虚拟机上启动并运行了所有内容。
我希望能够使用Linux,Laravel或MySQL之类的单词转录非常技术性的录音,这些录音不能很好地转录。我如何(轻松地)将这些单词添加到转录软件中,以便在说出时成功识别它们?
我试图按照Nikolay Shmyrev在这里找到的指示:
http://speechkitchen.org/kaldi-language-model-building/
我可以在向run_adapt.sh
添加新词汇后成功运行newwords.txt
脚本,但是当我尝试使用更新后的语言模型将音频文件转录为新词汇时,它无法识别新的词汇。
以下是我尝试遵循如何调整语言模型的说明的视频: