我使用Sphinx4用语法进行语音识别,但出于其他目的,我想要保存到用户没有语法说的音频文件。
基本上用户说了些什么,当它静音时,会创建一个音频文件,我想知道我是否可以重用Sphinx4系统来执行此操作。如果是,我该怎么做?
答案 0 :(得分:1)
很遗憾,目前不支持此功能。您需要实现自己的DataProcessor,它将缓存音频数据并通过API提供。如果您只想转储话语,请将WavWriter组件插入配置文件中的前端管道中:
<item>speechMarker </item>
<item>nonSpeechDataFilter </item>
<item>wavWriter </item>
<item>preemphasizer </item>
<item>windower </item>
.......
如果您只使用xml配置文件,则可以修改当前文件。否则,您可以在edu/cmu/sphinx/api/default.config.xml