我有一个装满书的服务器。每本书由多个资产组成。但是有些资产可用于多本书。
book1
|-pic1.png
|-pic2.png
|-pic3.png
book2
|-pic1.png(重复)
|-pic4.png
|-pic5.png
不能保证它们的名称相同。意思是pic1.png可能已经重命名了,但与以前的文件相同。
为了减少服务器开销,我想做的就是将所有文件移动到共享资产目录。但是我绝对要确保每个唯一的图像都被保留。
我的暴力破解方法是在每个文件上运行md5。哈希冲突为2 ^ 128,因此两个不同文件生成相同哈希的机会非常低。但是,我将对服务器上的所有资产(100,000+)重复此过程。我在这里没什么意思,但是我确实知道这会改变赔率(生日悖论?)
我的问题是...
谢谢。