我对如何使用 HTK进行语言建模感到困惑。 我按照 Voxforge 网站
中的教程示例进行操作http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial
经过训练和测试后,我的准确率达到了78%左右。我是用我的母语做的。现在我必须使用HTK进行语言建模。
是否有可用于此相同的教程?请帮帮我。
由于 speech_tri
答案 0 :(得分:1)
如果我正确理解你的问题,你正试图从“语法”转变为“n-gram语言模型”方法。这两种方法是指定识别器将返回的响应中允许哪些单词组合的替代方法。遵循Voxforge流程后,您可能会有语法。
语言模型来自对文本语料库的分析,该语料库定义了出现在一起的单词的概率。使用的文本语料库可以非常专业。有许多分析工具,如SRILM(http://www.speech.sri.com/projects/srilm/)和MITLM(https://github.com/mitlm/mitlm),它们将读取语料库并生成模型。
由于您使用的是母语,因此需要使用独特的文本语料库进行分析。获得测试语料库的一种方法是人工生成现有语法中的多个句子并将其用作语料库。然后使用新的语言模型,你只需将识别器指向它而不是语法,并希望最好。