多个相同文件的MD5冲突

时间:2018-12-04 15:38:59

标签: md5 hash-collision

我有一个装满书的服务器。每本书由多个资产组成。但是有些资产可用于多本书。

book1
|-pic1.png
|-pic2.png
|-pic3.png

book2
|-pic1.png(重复)
|-pic4.png
|-pic5.png

不能保证它们的名称相同。意思是pic1.png可能已经重命名了,但与以前的文件相同。

为了减少服务器开销,我想做的就是将所有文件移动到共享资产目录。但是我绝对要确保每个唯一的图像都被保留。

我的暴力破解方法是在每个文件上运行md5。哈希冲突为2 ^ 128,因此两个不同文件生成相同哈希的机会非常低。但是,我将对服务器上的所有资产(100,000+)重复此过程。我在这里没什么意思,但是我确实知道这会改变赔率(生日悖论?)

我的问题是...

  • 我可以创建多少个md5,而不会将哈希冲突的可能性提高到可接受的水平以上?
  • 我应该使用另一种低成本的文件完整性哈希算法吗?
  • 我是完全以错误的方式来做这件事吗?

谢谢。

0 个答案:

没有答案