应用错误收集

如果我正确理解你的问题，你正试图从“语法”转变为“n-gram语言模型”方法。这两种方法是指定识别器将返回的响应中允许哪些单词组合的替代方法。遵循Voxforge流程后，您可能会有语法。

语言模型来自对文本语料库的分析，该语料库定义了出现在一起的单词的概率。使用的文本语料库可以非常专业。有许多分析工具，如SRILM（http://www.speech.sri.com/projects/srilm/）和MITLM（https://github.com/mitlm/mitlm），它们将读取语料库并生成模型。

由于您使用的是母语，因此需要使用独特的文本语料库进行分析。获得测试语料库的一种方法是人工生成现有语法中的多个句子并将其用作语料库。然后使用新的语言模型，你只需将识别器指向它而不是语法，并希望最好。

如何使用HTK进行语言建模

1 个答案: