HTML5视频的字节范围请求(伪流)如何工作?

时间:2013-08-12 01:24:18

标签: video video-streaming html5-video video-processing

如果您为接受范围请求的服务器上托管的视频播放HTML5视频,那么当您尝试提前查看视频的非缓冲部分时,您会从网络流量中注意到该浏览器发出一个字节范围请求。我假设浏览器通过提前知道总视频大小并假设一个恒定的比特率来计算字节(如果你在进度条中点击一半,那么它将在中途点请求字节)。但特别是如果视频是可变比特率的,那么它所请求的字节似乎不太可能真正对应于用户点击的时间点,并且该字节可能会落在帧的中间。

一旦它开始以某个任意字节取出,浏览器如何知道下一帧的开头是什么?

2 个答案:

答案 0 :(得分:9)

我假设您的视频位于Mp4容器中。 mp4文件格式包含“盒子”的层次结构。其中一个框是Time-To-Sample(stts)框。此框包含每个帧的时间(以紧凑的方式)。从这里你可以使用Sample-to-Chunk(stsc)原子找到包含框架的'chunk'。最后,Chunk offset atom(stco)为您提供文件中的字节偏移量。

电影的总持续时间存储在电影标题原子(mvhd)中。当您移动画笔手柄时,会根据影片的持续时间估算时间,并在您放开画笔处理的位置,从先前下载的文件标题进行计算,并发出请求。

编辑: 如果不是mp4,其他容器也有类似的机制。编解码器是无关紧要的。

答案 1 :(得分:0)

许多视频/媒体类型(如MPEG)都采用固定相同的数据包进行编码。

MPEG最初是在188字节数据包上设计的(最初选择为ATM传输层的8个单元,但现在已经过时了)。因此,如果您寻求188字节大小的倍数,播放器将读取有效数据包&找到帧的开头时恢复同步。

当浏览器/播放器到达可以独立于任何其他帧解码的I帧(或关键帧)时,可以显示实际图像。 P帧和B帧是插值,所以如果你寻找它们,你还不能构建一张图片。

见:

相关问题