将拆分文件的MD5结果与整体的MD5进行比较

时间:2011-04-06 12:08:12

标签: split compare md5 average md5sum

我有一种情况,我有一个非常大的文件,我正在使用Linux“拆分”命令分成更小的部分。后来我使用linux“cat”命令将所有部件重新组合在一起。

然而,在此期间,我很好奇......

如果我在分割之前在大文件上获得MD5指纹,那么稍后在分割命令产生的所有独立文件部分上获得MD5指纹,是否有办法获取独立指纹并以某种方式推断出他们的部分的总和或平均值(或者你喜欢的全部)等于单个大文件的指纹?

通过(非常)松散的例子......

bigoldfile.txt MD5 = 737da789
smallfile1.txt MD5 = 23489a89
smallfile2.txt MD5 = 1238g89d
smallfile3.txt MD5 = 01234cd7

someoperator(23489a89,1238g89d,01234cd7)= 737da789(原始文件的指纹)

2 个答案:

答案 0 :(得分:1)

您可能无法做到这一点 - 内部MD5足够复杂,取决于实际数据以及“初始”哈希值。

你可以改为生成“增量”哈希 - 第一部分的哈希,第一部分和第二部分的哈希等等。

答案 1 :(得分:1)

不完全是,但下一个最好的事情是这样做: cat filepart1 filepart2 |的md5sum   要么 cat filepart * | md5sum

务必以正确的顺序将它们重新组合在一起。 通过管道cat的输出,你不必担心创建一个太大的组合文件。