在Windows 7中使用CMU Sphinx二进制文件时,可执行文件是如何使用的?

时间:2013-09-19 19:46:27

标签: cmusphinx

在Windows 7中使用CMU Sphinx时:打包的二进制文件没有说明或示例。我正在尝试对sphinx进行评估,并希望简单地将音频文件转换为文本以便快速尝试。没有示例,可执行文件是如何使用的?

1 个答案:

答案 0 :(得分:3)

Pocketsphinx发行版具有以下二进制文件:

  • pocketsphinx_batch - 用于测试测试数据库上的识别
  • pocketsphinx_continuous - 用于识别麦克风的音频

要使用pocketsphinx连续识别麦克风输入,请使用顶部文件夹中的以下内容:

bin\Release\pocketsphinx_continuous.exe -hmm  model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic

以16khz 16bit单声道格式识别来自WAV文件的音频:

bin\Release\pocketsphinx_continuous.exe -hmm  model\hmm\en_US\hub4wsj_sc_8k -lm model\lm\en_US\ehub4.5000.DMP -dict model\lm\en_US\cmu07a.dic -infile file.wav

您不应该假设此命令的识别结果是准确的。

CMUSphinx是一个复杂的软件,目前还不容易评估。你绝对不应该假设有一种快速简便的方法来正确测试它。最有可能进行5分钟的测试,你会得出结论它不起作用。

您需要了解语音识别的基础知识才能应用CMUSphinx。首先,至少阅读教程

http://cmusphinx.sourceforge.net/wiki/tutorial

正确的评估需要以下内容:

  • 您需要收集描述数据的代表集
  • 您需要了解默认通用设置对测试数据的准确度
  • 您需要了解准确性问题并尝试解决这些问题

要获得有关CMUSphinx的帮助,有必要询问论坛上的问题。您需要提供测试数据集才能获得有关准确性/性能的帮助。