Question

我想使用CMU Sphinx 5 prealpha进行实时语音识别（用于检测一些热门单词）并使用以下命令：

pocketsphinx_continuous -inmic yes\
                        -hmm zero_ru.cd_cont_4000\
                        -dict ru-dict-min.dic\
                        -lm ru-cmds-min.lm\
                        -samprate 16000

我对准确性感到满意，但是我发现有一个滞后。例如，我开始识别并说“ hello”，Sphinx在1-3秒后打印“ hello”（太好了！），我等了几分钟再说“ hello”，而Sphinx在10-18秒后打印了“ hello”。我等待了几分钟，然后再次说“你好”，Sphinx在3到7秒后打印了“你好”。任务管理器显示Sphinx使用2-17％的CPU。我该如何解决？有什么问题吗？

我使用的文件非常小：ru-dict-min.dic有28个单词，ru-min.lm有24个ngram。

Answer 1

声音活动检测器拾取的噪音过多，这就是狮身人面像花太多时间进行处理的原因。

CMU Sphinx的慢速语音识别

1 个答案: