从视频中提取视频字幕的帧的标准

时间:2017-02-16 04:34:27

标签: video lstm

对于视频字幕,我们需要将视频帧输入到递归神经网络中。如果我们提供视频,提取帧的标准标准是什么,例如帧采样率和图像分辨率要求。

我也想知道,当我们制作视频字幕时,我们首先提取视频的所有帧,然后将它们保存为输入,或者我们在处理它们的同时提取帧。

1 个答案:

答案 0 :(得分:0)

它的问题并不完全清楚,因此可能值得一提的是,字幕和字幕通常存储在与视频本身不同的文件中 - 即它们不会直接添加到视频流中。还值得注意的是,大多数视频容器(例如MP4文件)将具有单独的视频和音频轨道。

根据您要添加的字幕类型,方法可能会有所不同 - 例如,如果字幕是简单的描述性注释,那么它们通常会手动添加,以便在编辑器选择的视频中的任何位置显示。

如果字幕是提供演讲的成绩单,那么他们显然必须与音频和视频流对齐,并且通常会从音频流生成并使用其时间戳。

不同地区和不同部署的字幕有多种不同的标准,但最常见的是:

  • SMPTE-TT
  • TTML

通常,无论格式如何,都会有一种机制将标题(如果需要)与视频的任何帧相关联 - 即允许玩家将特定视频帧与特定标题链接的时间码。