我正在编写一个文件系统重复数据删除器。第一次传递生成md5校验和,第二次传递比较具有相同校验和的文件。
是否有一些字符串集合不同但生成相同的md5校验和我可以合并到我的测试用例集合中?
更新:mjv的答案指向这两个文件,非常适合我的测试用例。
答案 0 :(得分:3)
您可以在此url找到几个具有相同MD5哈希值的不同X.509证书文件。
我不知道MD5重复文件存储库,但您可以使用Vlastimil Klima's page on MD5 Collision
中描述的可执行文件和/或技术创建自己的文件库。事实上,MD5在抗冲击方面的弱点已经为人所知,但我不会因为你的文件系统负责人这样的项目而取消它的资格。你可能只想添加一些额外的标准(从计算上讲可以非常便宜),以进一步降低重复的可能性。
或者,出于测试目的,您可以简单地修改MD5比较逻辑,以便它认为某些MD5值相同,即使它们不相同(例如,如果MD5的最低有效字节匹配,或系统地,每20次比较,或者随意...)。这可能不如制造有效的MD5“双胞胎”痛苦。
答案 1 :(得分:0)
http://www.nsrl.nist.gov/可能就是你想要的。