在Windows 7中使用CMU Sphinx时:打包的二进制文件没有说明或示例。我正在尝试对sphinx进行评估,并希望简单地将音频文件转换为文本以便快速尝试。没有示例,可执行文件是如何使用的?
答案 0 :(得分:3)
Pocketsphinx发行版具有以下二进制文件:
要使用pocketsphinx连续识别麦克风输入,请使用顶部文件夹中的以下内容:
bin\Release\pocketsphinx_continuous.exe -hmm model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic
以16khz 16bit单声道格式识别来自WAV文件的音频:
bin\Release\pocketsphinx_continuous.exe -hmm model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic -infile file.wav
您不应该假设此命令的识别结果是准确的。
CMUSphinx是一个复杂的软件,目前还不容易评估。你绝对不应该假设有一种快速简便的方法来正确测试它。最有可能进行5分钟的测试,你会得出结论它不起作用。
您需要了解语音识别的基础知识才能应用CMUSphinx。首先,至少阅读教程
http://cmusphinx.sourceforge.net/wiki/tutorial
正确的评估需要以下内容:
要获得有关CMUSphinx的帮助,有必要询问论坛上的问题。您需要提供测试数据集才能获得有关准确性/性能的帮助。