我正在尝试使用Sphinx II实现语音识别器客户端,我的目标是让某人在文本中阅读书面句子并对每个单词都有一个置信度分数。 因此,我正在使用有限状态语法和有限字典 我有一些工作,但置信度得分非常低(<0.30)。我使用的设置与Sphinx 2的简单Reco示例相同。 由于每个单词只有一个发音的可能性(每个单词在语法中是一个状态),我通常应该具有高分和时间有效的识别,但该假设需要时间来计算。一旦发出这个词,我也会得到假设。 所以现在我实际上并不知道该去哪里改进它。我是否使用正确的解决方案来解决这类问题?我是否应该使用语言模型,如果是,如何将上下文限制为故事中的给定句子?
我还需要使用狮身人面像教练吗?到目前为止,我已经使用Web工具生成了语言模型/字典。
非常感谢您的帮助。 谢谢,Boris Gougeon