ffmpeg从mp4获取音频流并将其发送到语音识别

时间:2013-07-12 09:25:30

标签: c# ffmpeg speech-recognition mp4

我有几个.mp4视频文件,其中每个视频文件的开头都有一个单词,我想加载这些文件获取音频检查所说的单词是什么,并相应地重命名该文件。

目前我正在做的是,将所有mp4文件转换为wav,然后发送语音识别,然后重命名。

有没有办法缩短“转换为wav”部分并直接将mp4音频流发送到语音识别?

谢谢,

0 个答案:

没有答案