当我使用MemoryStream时,为什么这两个文件会散列到相同的值?

时间:2009-11-11 14:04:28

标签: c# hash memorystream sha512

我正在编写一个从jpg文件创建哈希的c#例程。如果我将一个字节数组传递给我的SHA512对象然后我得到了预期的行为,但是,如果我传入一个内存流,这两个文件总是散列到相同的值。

示例1:

        SHA512 mySHA512 = SHA512.Create();

        Image img1 = Image.FromFile(@"d:\img1.jpg");
        Image img2 = Image.FromFile(@"d:\img2.jpg");
        MemoryStream ms1 = new MemoryStream();
        MemoryStream ms2 = new MemoryStream();

        img1.Save(ms1, ImageFormat.Jpeg);
        byte[] buf1 = ms1.GetBuffer();
        byte[] hash1 = mySHA512.ComputeHash(buf1);

        img2.Save(ms2, ImageFormat.Jpeg);
        byte[] buf2 = ms2.GetBuffer();
        byte[] hash2 = mySHA512.ComputeHash(buf2);

        if (Convert.ToBase64String(hash1) == Convert.ToBase64String(hash2))
            MessageBox.Show("Hashed the same");
        else
            MessageBox.Show("Different hashes");

产生“不同的哈希”。但ComputeHash方法的一个重载需要一个流对象,我宁愿使用它。当我这样做时:

        SHA512 mySHA512 = SHA512.Create();

        Image img1 = Image.FromFile(@"d:\img1.jpg");
        Image img2 = Image.FromFile(@"d:\img2.jpg");
        MemoryStream ms1 = new MemoryStream();
        MemoryStream ms2 = new MemoryStream();

        img1.Save(ms1, ImageFormat.Jpeg);
        byte[] hash1 = mySHA512.ComputeHash(ms1);

        img2.Save(ms2, ImageFormat.Jpeg);
        byte[] hash2 = mySHA512.ComputeHash(ms2);

        if (Convert.ToBase64String(hash1) == Convert.ToBase64String(hash2))
            MessageBox.Show("Hashed the same");
        else
            MessageBox.Show("Different hashes");

产生“Hashed the same”。

这里发生了什么,我错过了?

1 个答案:

答案 0 :(得分:16)

你没有倒回你的MemoryStreams,所以哈希是从一个空的字节序列计算出来的。使用

ms1.Position = 0;
ms2.Position = 0;

致电Save

还有一点需要注意:不要以这种方式使用GetBuffer。使用ToArray,它将为您提供与流的长度相同大小的字节数组 - GetBuffer返回原始缓冲区,该缓冲区将(通常)具有一些填充,您不会意外使用它。如果您确定只使用相关部分,则可以使用GetBuffer - 当然 - 这可以避免创建新的数据副本。