文件检查自动更新

时间:2012-02-09 18:31:29

标签: c# checksum

我尝试使用自动更新程序为我的程序创建文件检查程序。

想法是用户只需为我的程序下载启动器,然后启动器将在本地用户指定的几个设置上下载所有必需的文件。并且它还会检查文件是否: 1)最新的, 2)腐败, 3)未找到, 4)需要更新。 2,3,4会导致文件检查器将文件添加到To_Download列表,而如果它是1,文件检查器会将其标记为有效并继续。

为了做到这一点,我想写一个校验和函数,检查所有文件并将哈希值与已知的健康哈希值进行比较(我使用非托管SHA1)。但是,如果我然后从服务器下载该文件的新实例,则校验和最终完全不同,即使我知道文件完全相同,除了不同的mod /创建时间。

我需要一个可靠的文件检查,这很快,但不容易绕过。同时让我相信用户计算机上的文件与服务器上的文件相同。

我使用Sha1的原因是我读到它有较少的碰撞'碰撞更加昂贵'创建与md5替代品。

目前正在使用

using (FileStream fs = new FileStream(FilePath, FileMode.Open, FileAccess.Read))
using (BinaryReader file = new BinaryReader(fs))
{
    SHA1CryptoServiceProvider unmanaged = new SHA1CryptoServiceProvider();
    byte[] retVal = unmanaged.ComputeHash(file.ReadBytes(Convert.ToInt32(fs.Length)));
    file.Close();

    StringBuilder stringBuilder = new StringBuilder();
    if (retVal != null)
    {
        foreach (byte b in retVal)
        {
            stringBuilder.Append(HexStringTable[b]);
        }
    }
}

和hexstringtable

private static readonly string[] HexStringTable = new string[]
    {
        "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
        "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
        "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
        "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
        "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
        "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
        "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
        "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
        "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
        "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
        "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
        "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
        "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
        "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
        "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
        "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF"
    };

为什么下载新文件的哈希值与预期不同(因为它完全相同?)

修改

我觉得因为没有比较hexeditor中的2个文件而感到愚蠢..似乎问题是这些文件中缺少1个字节,我现在已经解决了这个问题。目前检查所有7000个文件需要60-70秒,有没有可能进一步提高速度呢?

2 个答案:

答案 0 :(得分:1)

您是否尝试比较文件以查看更改内容?如果SHA1不同,则文件不同(modtime与此无关。)尝试在十六进制编辑器中对它们进行区分或比较,以查看不同之处。

答案 1 :(得分:1)

您的逻辑似乎是正确的,并且会生成应该匹配相同文件的哈希码字符串。但是,您可以做得更短,而无需查找表(或仅出于性能原因而将该部分保留):

public string CreateFileHash(string filePath)
{
    using (FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read))
    {
        SHA1CryptoServiceProvider unmanaged = new SHA1CryptoServiceProvider();
        byte[] retVal = unmanaged.ComputeHash(fs);
        return string.Join("", retVal.Select(x=> x.ToString("x2")));
    }
}