使用Sphinx4将话语保存到音频文件

时间:2014-04-18 17:57:58

标签: cmusphinx sphinx4

我使用Sphinx4用语法进行语音识别,但出于其他目的,我想要保存到用户没有语法说的音频文件。

基本上用户说了些什么,当它静音时,会创建一个音频文件,我想知道我是否可以重用Sphinx4系统来执行此操作。如果是,我该怎么做?

1 个答案:

答案 0 :(得分:1)

很遗憾,目前不支持此功能。您需要实现自己的DataProcessor,它将缓存音频数据并通过API提供。如果您只想转储话语,请将WavWriter组件插入配置文件中的前端管道中:

  <item>speechMarker </item>
  <item>nonSpeechDataFilter </item>
  <item>wavWriter </item>
  <item>preemphasizer </item>
  <item>windower </item>
  .......

                                      

如果您只使用xml配置文件,则可以修改当前文件。否则,您可以在edu/cmu/sphinx/api/default.config.xml

中修改默认配置文件