我有一份约。 2500张图片。对于每个图像,我创建一个SHA1哈希,我可以用它来引用每个图片。我还使用哈希来查找列表中的重复图像。
默认情况下,SHA1哈希长度为40个字符。目前我将哈希值减少到前7个字符。 这是一个合理的长度还是碰撞可用性太高了?
答案 0 :(得分:2)
可接受的概率是多少?
注意:SHA1哈希是20个字节,你的意思是40个十六进制字符吗?
7个十六进制字符为7 * 4 = 28位。
从table开始,查看32位和2900个元素,对于IMO不够好的碰撞,概率为0.01%。
为什么不使用完整哈希和20字节而不是十六进制?