在sphinx 4中是否可以识别所有可能的单词

时间:2013-08-13 19:01:25

标签: cmusphinx sphinx4

虽然我有一些问题要让sphinx 4最初工作但现在它工作得很好。由于语法是有限的,无论是JSGF还是N-Gram,我都无法让狮身人面像识别出每一个可能的单词或句子。我想建立像基于语音的谷歌搜索。由于搜索可能包含任何可能的单词或单词组合。在语法中添加所有字典单词很麻烦。请帮助。

1 个答案:

答案 0 :(得分:3)

不,这是不可能的。每个来自Google的语音识别器都使用有限的词汇。谷歌使用了约150万字的大字,但仍然有限。所以CMUSphinx。您可以通过尝试识别罕见的专有名称来验证这一点,即使使用Google也几乎不可能。

实际的解决方案是使用大词汇量的大型语言模型。

这是一个开放的研究问题,用于检测音频流中的新单词,并使用口头或其他类型的反馈添加识别器。