图像哈希非常相似的图像

时间:2012-04-21 12:05:54

标签: image image-processing hash

我正在截取应用程序的屏幕截图,并试图检测之前是否已经看过确切的图像。我希望将微不足道的变化视为不同的 - 例如如果图像中有文字,并且拼写发生变化,则表示不匹配。

我已成功使用屏幕截图图像内容的MD5哈希在已知图像的数据库中查找,并检测以前是否已经看过它。

现在,我已将其移植到另一台机器上,尽管我尝试完全匹配配置,但我的旧机器的图像却略有不同。当我说不同的时候,变化是微不足道的 - 如果我把旧的和新的图像炸掉然后在那之间轻弹,我就看不到任何一个区别!尽管如此,ImageMagick的compare命令可以看到一些不同的像素。

所以我的MD5哈希不再匹配了。我需要一个image hash

,而不是一个简单的MD5哈希

进行我的研究,我发现大多数图像哈希试图相当慷慨 - 它们接受调整大小,变换和水印的图像,并带有相应的误报。我想要一个更严格的图像哈希 - 唯一允许的变化是颜色的微小变化。

有人可以推荐图像哈希库或算法吗? (不是应用程序,如dupdetector)。

请记住:我的要求与许多类似的问题有所不同,因为我不想要像shrinkingpHash这样的自由主义算法,我不想要像{{3这样的比较工具}或structural similarity

我想要一个哈希,使非常相似的图像给出相同的哈希值。这甚至可能吗?

1 个答案:

答案 0 :(得分:1)

您可以查看以下名为“光谱散列”的论文。它是一种算法,旨在从图像生成哈希码,以便将相似的图像组合在一起(参见本文末尾的检索示例)。这是一个很好的起点。

链接:http://www.cs.huji.ac.il/~yweiss/SpectralHashing/