我想使用CMU Sphinx 5 prealpha进行实时语音识别(用于检测一些热门单词)并使用以下命令:
pocketsphinx_continuous -inmic yes\
-hmm zero_ru.cd_cont_4000\
-dict ru-dict-min.dic\
-lm ru-cmds-min.lm\
-samprate 16000
我对准确性感到满意,但是我发现有一个滞后。 例如,我开始识别并说“ hello”,Sphinx在1-3秒后打印“ hello”(太好了!),我等了几分钟再说“ hello”,而Sphinx在10-18秒后打印了“ hello”。我等待了几分钟,然后再次说“你好”,Sphinx在3到7秒后打印了“你好”。 任务管理器显示Sphinx使用2-17%的CPU。 我该如何解决?有什么问题吗?
我使用的文件非常小:ru-dict-min.dic有28个单词,ru-min.lm有24个ngram。
答案 0 :(得分:0)
声音活动检测器拾取的噪音过多,这就是狮身人面像花太多时间进行处理的原因。