我正在寻找快速但不一定好的哈希算法。我知道MD5可能会被破坏或被恶意制作,但是假设我不是为了安全而使用它们,只是为了确保文件与我最初对其建立索引时相同,是否足够?
在平均发生冲突之前,我可以合理地使用MD5哈希扩展到什么程度?
我想将数据库记录存储为FILE(id,path,size,md5)
我应该能够使md5唯一,还是没有足够的熵。如果不是MD5,那么该哈希将扩展到我可以出于所有意图和目的将其称为唯一的点。即使比较慢,SHA1也足够。
我有一个N〜= 50,000,000的数据集