md5碰撞数据库?

时间:2011-04-01 22:08:59

标签: md5

我正在编写一个文件系统重复数据删除器。第一次传递生成md5校验和,第二次传递比较具有相同校验和的文件。

是否有一些字符串集合不同但生成相同的md5校验和我可以合并到我的测试用例集合中?

更新:mjv的答案指向这两个文件,非常适合我的测试用例。

2 个答案:

答案 0 :(得分:3)

您可以在此url找到几个具有相同MD5哈希值的不同X.509证书文件。

我不知道MD5重复文件存储库,但您可以使用Vlastimil Klima's page on MD5 Collision

中描述的可执行文件和/或技术创建自己的文件库。

事实上,MD5在抗冲击方面的弱点已经为人所知,但我不会因为你的文件系统负责人这样的项目而取消它的资格。你可能只想添加一些额外的标准(从计算上讲可以非常便宜),以进一步降低重复的可能性。

或者,出于测试目的,您可以简单地修改MD5比较逻辑,以便它认为某些MD5值相同,即使它们不相同(例如,如果MD5的最低有效字节匹配,或系统地,每20次比较,或者随意...)。这可能不如制造有效的MD5“双胞胎”痛苦。

答案 1 :(得分:0)

http://www.nsrl.nist.gov/可能就是你想要的。