我一直在尝试尝试让音素正确 检测。我一直在使用我自己的几个音频文件和 结果不佳。然后我尝试使用提供的 goforward.raw 文件 它显示了类似的问题结果。
我的安装似乎很好,并且它的句子效果很好:
% pocketsphinx_continuous -infile goforward.raw
go forward ten meters
但是-allphone
选项并没有达到我的预期。
% pocketsphinx_continuous -infile goforward.raw -allphone yes
SIL D SIL G OW F AO R W ER D JH T T EH N N M IY IH ZH ER Z S V SIL
这并不可怕,但有一些重复和奇怪的补充。是 有解决方法吗?这是一个常见的结果吗?我需要吗? 调整一些选项或原始文件?
我最终只希望处理一个单词输入,所以任何提示 完成这一点非常感谢。
System is Arch Linux with pocketsphinx 5prealpha。我试过这个 使用源安装以及AUR包。
答案 0 :(得分:1)
使用documentation中提供的命令:
pocketsphinx_continuous -infile test/data/goforward.raw \
-allphone model/en-us/en-us-phone.lm.bin \
-beam 1e-20 -pbeam 1e-20 -lw 2.0