我正在使用Ubuntu 12.04
,Python 2.7
& PocketSphinx
。
我使用在线dictionary
制作了自定义language model
,LM tool
。使用pocketsphinx_continous
解码口头语音可以让我100%准确。
但是使用PyAudio
录制Python
中的声音会识别文字,但会在主要内容中添加“A”和“AND”,如下图所示
如何治愈呢?
答案 0 :(得分:2)
精确度降低的原因是你在话语周围添加了一个人为的零沉默区域,这会破坏频谱并降低准确性。别那样做。相反,只需识别您录制的声音。
如果您仍需要解码零静音区域,则需要添加
dither="yes"
解码器参数中的选项,以便让解码器解决它们。添加此选项后,结果将是准确的。