我想计算一个可能不适合内存的大型tiff文件的校验和。如果我改为计算每个页面的校验和,然后计算页面校验和数组的校验和,或者我会遇到一个我没有看到的数学问题,唯一正确的方法就是进入,我会得到一个可靠的值吗?事实上与整个事情一起工作?
谢谢!
答案 0 :(得分:0)
我不知道是否正确理解了这个问题,但是对于大多数校验和算法,您只需要加载small part of the message to memory。因为可以在流而不是内存位置上进行操作,并且已经完成before。
修改强>:
我只知道在校验和短消息时你必须小心使用Adler-32,你不会覆盖整个散列空间而且更容易出现误报(因此,校验和数组可能是一条短消息) 。
使用加密哈希我真的不知道。我的直觉是md5(msg1 + msg2 + ...)和md5一样可靠(md5(msg1)+ md5(msg2)+ ...)但是我们必须等待比我聪明的人给出明确的答案:)