标签: youtube subtitle transcription
Youtube有一项功能,您可以将视频中所说的所有内容都作为文本提交,youtube会自动将该抄本自动同步到字幕中。 是使用语音识别还是通过音频频谱位移来计算同步。网上也有几种类似的服务。
如何开发这样的系统?