使用processRaw尝试 edu.cmu.sphinx.pocketsphinx 来检测语音。
使用以下配置:
en-us.lm.bin语言模型
en-us-ptm声学模型
cmudict-en-us.dict字典
还将remove_noise设置为True 并采样到8000
我想进行Ngram搜索。
这是我使用的循环:
Decoder decoder = recognizer.getDecoder();
int chunk_size = 1024;
int index_start = 0;
int index_finish = index_start+chunk_size-1;
boolean doit = true;
decoder.startUtt();
while (doit)
{
short[] slice = Arrays.copyOfRange(audioBuffer, index_start, index_finish);
int processRawRes = decoder.processRaw((slice), slice.length, false, false);
index_start = index_finish;
index_finish = index_start+chunk_size-1;
if (index_finish>audioBuffer.length-1)
{
doit = false;
}
}// while (doit)
decoder.endUtt();
我什么时候打电话
decoder.getInSpeech();
谢谢。