使用processRaw尝试 edu.cmu.sphinx.pocketsphinx 来检测沉默。
使用以下配置:
en-us.lm.bin语言模型
en-us-ptm声学模型
cmudict-en-us.dict字典
还要将remove_noise设置为True并将采样率设置为8000
我想进行Ngram搜索。
当While循环调用processRaw完成时,我同时调用
hypothesis.getHypstr()和
decoder.getInSpeech()
为什么getHypstr返回空但getInSpeech返回 True ,而实际上给processRaw的输入参数中没有语音。
谢谢。
答案 0 :(得分:0)
En-us-ptm是16khz模型,无法在8000采样率下使用。这会导致hypstr产生不良结果。
如果getInSpeech返回true,则可能意味着系统接受了很小的噪音作为语音。