当我们附加文件时,当我们有哈希值时,是否可以更新校验和(MD5,SHA1)。
是否可以在不读取整个文件A的情况下更新新文件的MD5哈希值以创建文件哈希(因为如果文件A太大而且需要花费太多时间)。
答案 0 :(得分:3)
当且仅当,您可以选择新的数据块由一个0x80字节,一定数量的0x00字节组成,具体取决于文件A的大小,以及4个字节包含文件A的位长度,后跟您喜欢的任何其他数据,是的。
这称为Length Extension Attack,是使用Merkle-Damgard construction的所有哈希的加密弱点,https://crypto.stackexchange.com/questions/17733/sha1-multipart-calculation包括MD5 SHA1和SHA-2系列,但不包括SHA-3系列。这不是一个真正的编程问题,更适合于crypto.SX,其中已经有很多问题,例如https://crypto.stackexchange.com/questions/3978/understanding-the-length-extension-attack和https://imgur.com/2aOgCKB
但是,如果您保存哈希的正常内部状态,那么在数据结束前的最后一个完整阻止,并恢复并恢复更新'从那里添加(不受限制的)新数据,因为我相信其他答案或多或少的意图,你可以计算新的哈希(如果你想重复这个过程,可以计算新保存的状态)。 如果以及如何访问此状态,以及它是如何表示的,取决于您使用的实现。您标记了Java,尽管您的实际Q没有提及它;使用加密Java提供(JCA)将非常困难,因为JCA故意隐藏了一系列简化的抽象外观类背后的所有支持的算法的细节。 OTOH如果你自己(重新)编码这些哈希值,访问内部状态可能非常容易。如果你使用BouncyCastle'轻量级'实施可能并不是很难,但可能会有改变实施的风险,但我必须仔细研究。存储和检索它可能是也可能不是问题。
答案 1 :(得分:2)
据维基百科关于MD5或SHA1的文章我可以看到,这个应该是。您必须将旧散列拆分回内部状态变量(应该只是一些位移),然后继续加速新散列。免责声明:我自己没有尝试过,只需阅读有关算法的wikipages。
无论如何:MD5和SHA1 已损坏。请使用较新的sha2或sha3哈希。
答案 2 :(得分:0)
我认为你必须再次阅读整个文件。
MD5通过维护一堆内部寄存器来工作(IIRC)。随着算法消耗每个字节而改变。因此,从先前的MD5计算继续的唯一方法是,如果您以某种方式存储了那些“寄存器”的状态。在前一个终点。
看一下MD5计算的内部结构 - 我认为Javascript中有一些说明了一般原则,如果你找不到Java。即便写得很难看(我想这也是重点)。