假设给定以下numpy数组:时间步长t-1的BGR视频帧,时间步长t的运动矢量和时间步长t的残差图像。另外,假设视频帧,运动矢量和残留图像来自使用mpeg-4压缩的视频。
使用这些输入,我们将如何使用ffmpeg解码时间步长t的BGR视频帧?
我尝试通过以下方式手动重建t帧:(1)创建参考帧,它只是t-1帧的副本; (2)基于运动矢量,通过从t-1帧到参考帧复制16×16像素块进行运动补偿; (3)将残差图像添加到运动补偿的参考帧中。
但是,最终的预测t帧与实际t帧不完全匹配,因此我认为这可能不是正确的方法。