标签: c# ffmpeg speech-recognition mp4
我有几个.mp4视频文件,其中每个视频文件的开头都有一个单词,我想加载这些文件获取音频检查所说的单词是什么,并相应地重命名该文件。
目前我正在做的是,将所有mp4文件转换为wav,然后发送语音识别,然后重命名。
有没有办法缩短“转换为wav”部分并直接将mp4音频流发送到语音识别?
谢谢,