machine-learning - 使用OpenVINO进行语音识别 - Thinbug

使用OpenVINO进行语音识别

时间：2019-12-19 11:32:29

标签： machine-learning speech-recognition openvino

我想实现一个python项目，其中输入将是.mp4文件，而输出将是视频的字幕或字幕。约束是使用OpenVINO。我该怎么办？

1 个答案:

答案 0 :(得分：1)

mp4是一个容器。我相信当前的OpenVINO语音演示/样本都使用wav文件，因为这是该模型所训练的。

如果您可以使用工具将mp3或音频从mp4容器转换为wav格式，则可能会起作用。

speech rec demo