应用错误收集

H.264或视频编码器一般如何计算两帧的残差图像？

时间：2011-07-06 01:04:19

标签： compression h.264 video-encoding

我一直在努力了解视频编码如何适用于现代编码器，特别是H264。在文档中经常提到残差帧是根据当前p帧和最后一个i帧之间的差异创建的（假设在预测中未使用以下帧）。我知道使用YUV颜色空间（可能是YV12），并且一个图像从另一个图像“减去”然后形成残差。我不明白的是这种减法究竟是如何运作的。我不认为这是差异的绝对值，因为这将是模棱两可的。获得这种差异的每像素公式是什么？

1 个答案:

答案 0 :(得分：6)

减法只是视频编码中的一小步;大多数现代视频编码背后的核心原则是motion estimation，其次是motion compensation。基本上，运动估计的过程生成向量，该向量示出连续帧中的宏块之间的偏移。但是，这些向量中总是存在一些错误。

所以会发生什么是编码器将输出两个矢量偏移，而“残差”就是剩下的。残差不仅仅是两帧之间的差异;它是考虑运动估计后的两个帧之间的差异。请参阅维基百科关于补偿的文章中的“运动补偿差异”图像，以清楚地说明这一点 - 请注意，运动补偿差异远小于“哑”残差。

Here's a decent PDF that goes over some of the basics

其他几点说明：

是的，始终使用YUV，通常大多数编码器都使用YV12或其他一些色度二次采样格式

减法必须分别在Y，U和V帧上进行（将它们视为三个独立的通道，所有这些通道都需要进行编码 - 然后很明显减法必须如何发生）。在Y，U和V平面上可能会或可能不会发生运动估计;有时编码器只在Y（亮度）值上进行，以牺牲质量为代价来节省一点CPU。

相关问题

Flowplayer H.264视频编码

H.264或视频编码器一般如何计算两帧的残差图像？

解码在iOS上编码为H.264的单帧

使用ffmpeg解码H.264帧时出错

用于个人视频备份的H.264或H.265

在python中使用opencv读取h.264视频帧Enthough（mac Yosemite）

Silverlight MediaElement需要许多H.264帧来渲染一个图像

H.264视频格式（YUV420p与YUV420sp）

H.264残差帧如何存储和压缩

UWP：如何对原始视频帧进行H.264编码并获得编码的帧

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？