Question

我使用Sphinx4用语法进行语音识别，但出于其他目的，我想要保存到用户没有语法说的音频文件。

基本上用户说了些什么，当它静音时，会创建一个音频文件，我想知道我是否可以重用Sphinx4系统来执行此操作。如果是，我该怎么做？

Answer 1

很遗憾，目前不支持此功能。您需要实现自己的DataProcessor，它将缓存音频数据并通过API提供。如果您只想转储话语，请将WavWriter组件插入配置文件中的前端管道中：

  <item>speechMarker </item>
  <item>nonSpeechDataFilter </item>
  <item>wavWriter </item>
  <item>preemphasizer </item>
  <item>windower </item>
  .......

如果您只使用xml配置文件，则可以修改当前文件。否则，您可以在edu/cmu/sphinx/api/default.config.xml

中修改默认配置文件

使用Sphinx4将话语保存到音频文件

1 个答案: