Question

目标：我想从动画GIF中抓取最佳帧并将其用作静态预览图像。我相信最好的框架是显示最多内容的框架 - 不一定是第一帧或最后一帧。

以此GIF为例：

-

这是第一帧：

-

这是第28帧：

很明显，第28帧代表了整个GIF。

我如何能够以编程方式确定一帧是否具有更多像素/内容？任何您可以指出我的想法，想法，包/模块或文章都将不胜感激。

Answer 1

这可以实现的一种简单方法是估计每个图像的entropy并选择具有最大熵的帧。

在信息论中，熵可以被认为是图像的“随机性”。单色图像非常可预测，分布越平坦，越随机。这与Arthur-R描述的压缩方法高度相关，因为熵是无损压缩数据的下限。

估算熵

估计熵的一种方法是使用直方图来近似像素强度的概率质量函数。为了生成下面的图，我首先将图像转换为灰度，然后使用bin间距1计算直方图（对于0到255之间的像素值）。然后，对直方图进行归一化，使得二进制数总和为1.该归一化直方图是像素概率质量函数的近似值。

使用这个概率质量函数，我们可以很容易地估计灰度图像的熵，由下面的等式描述

H = E[-log(p(x))]

H是熵，E是预期值，p(x)是任何给定像素获取值x的概率。

可以通过简单地为直方图中的每个值H计算-p(x)*log(p(x))，然后将它们加在一起来估算p(x)。

您的示例的熵与帧数的关系图。

框架21（第22帧）具有最高熵。

<强>观察

此处计算的熵不等于ε的真熵因为它假设每个像素是从同一分布中独立采样的。为了获得真正的熵，我们需要知道我们将无法知道的图像的联合分布理解生成图像的基础随机过程（这将包括人类互动）。但是，我不认为真正的熵会非常有用，这个措施应该是合理估计图像中的内容量。
如果某些不那么有趣的帧，此方法将失败包含比最多噪声（随机彩色像素）更多的噪声有趣的帧，因为噪声导致高熵。例如，下面的图像是纯粹的均匀噪声，因此具有最大熵（H = 8位），即不可能压缩。