Question

我在Python和C中尝试使用crc32，但我的结果不匹配。

C:
#include <stdio.h>
#include <stdlib.h>
#include <zlib.h>

#define NUM_BYTES 9

int
main(void)
{

  uint8_t bytes[NUM_BYTES] = {1, 2, 3, 4, 5, 6, 7, 8, 9};

  uint32_t crc = crc32(0L, Z_NULL, 0);

  for (int i = 0; i < NUM_BYTES; ++i) {
    crc = crc32(crc, bytes, 1);
  }

  printf("CRC32 value is: %" PRIu32 "\n", crc);
}

提供输出CRC32 value is: 3136421207

的Python

In [1]: import zlib
In [2]: int(zlib.crc32("123456789") + 2**32)
Out[2]: 3421780262

在python中我添加了2 ** 32到＆＃34;演员＆＃34; to unsigned int。

我在这里缺少什么？

[编辑1]

现在我尝试了

In [8]: crc = 0;
In [9]: for i in xrange(1,10):
   ...:     crc = zlib.crc32(str(i), crc)
   ...:     
In [10]: crc
Out[10]: -873187034
In [11]: crc+2**32
Out[11]: 3421780262

和

int
main(void)
{

  uint32_t value = 123456789L;

  uint32_t crc = crc32(0L, Z_NULL, 0);

  crc = crc32(crc, &value, 4);

  printf("CRC32 value is: %" PRIu32 "\n", crc);
}

结果仍然不一样。

Answer 1

您的原始C和Python代码段中存在问题。至于你的第二个C片段，我还没有尝试编译它，但它不可移植，因为int中的字节顺序是依赖于平台的。因此，它会根据CPU的endianness给出不同的结果。

Serge Ballesta提到的一个问题是{1, 2, 3, 4, 5, 6, 7, 8, 9}和{'1', '2', '3', '4', '5', '6', '7', '8', '9'}之间的区别。另一个问题是原始C代码中的循环实际上并没有扫描数据，因为你没有在循环中使用i，正如bav所提到的那样。

<强> crctest.c

#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <zlib.h>

#define NUM_BYTES 9

// gcc -std=c99 -lz -o crctest test.c

void do_crc(uint8_t *bytes)
{
    uint32_t crc = crc32(0L, Z_NULL, 0);

    for (int i = 0; i < NUM_BYTES; ++i)
    {
        crc = crc32(crc, bytes + i, 1);
    }

    printf("CRC32 value is: %lu\n", crc);
}

int main(void)
{
    uint8_t bytes0[NUM_BYTES] = {1, 2, 3, 4, 5, 6, 7, 8, 9};
    uint8_t bytes1[NUM_BYTES] = {'1', '2', '3', '4', '5', '6', '7', '8', '9'};

    do_crc(bytes0);
    do_crc(bytes1);
}

<强>输出

CRC32 value is: 1089448862
CRC32 value is: 3421780262

<强> crctest.py

#! /usr/bin/env python

import zlib

def do_crc(s):
    n = zlib.crc32(s)
    return n + (1<<32) if n < 0 else n

s = b'\x01\x02\x03\x04\x05\x06\x07\x08\x09'
print `s`, do_crc(s)

s = b'123456789'
print `s`, do_crc(s)

<强>输出

'\x01\x02\x03\x04\x05\x06\x07\x08\t' 1089448862
'123456789' 3421780262

修改

这是在Python中处理转换的更好方法：

def do_crc(s): n = zlib.crc32(s) return n & 0xffffffff

有关此主题的更多信息，请参阅此处的答案：How to convert signed to unsigned integer in python。

Answer 2

第一个c-snippet的确切副本会产生相同的结果：

>>> bytes = [chr(i) for i in range(1, 10)]
>>> crc = zlib.crc32('', 0)
>>> for _ in range(9):
...     crc = zlib.crc32(bytes[0], crc)
>>> crc + 2**32
3136421207

请注意，您不要在循环中使用i变量。

Answer 3

根据www.lammertbies.nl详细参考CRC计算和C例程，123456789中的ASCII字符串0xCBF43926的CRC32，即3421780262作为无符号32十进制形式的整数。

这意味着您的Python计算是正确的，但要在C中获得相同的结果，您应该编写

uint8_t bytes[NUM_BYTES] = {'1', '2', '3', '4', '5', '6', '7', '8', '9'};
uint32_t crc = crc32(0L, Z_NULL, 0);

或者，如果您想要的确是uint8_t bytes[NUM_BYTES] = {1, 2, 3, 4, 5, 6, 7, 8, 9};的crc 32，则必须在python 2.x中使用：

s = ''
for i in range(10):
    s += chr(i)
s

输出：'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t'

然后

zlib.crc32(s)

输出：1164760902

Nota：在python 3.x中，你会写：s = bytes(range(10))

Answer 4

这是因为CRC32是在比特级计算的。

您正在计算C中每个数字的CRC（数据大小为9个字节），并在python中计算整数（可能只需要4或8个字节来表示）。

字节数可能不同，将导致不同的CRC。

尝试计算C中123456789的CRC。

编辑：关于str(i)，编码可能不同，而且，它是ASCII值。由于1和'1'不相同，因此您将无法获得相同的CRC。尝试

crc = zlib.crc32(int(str(i)), crc) # or simply i

在C代码中，number只有4个字节，而在python中，它是string。 32位整数和数组将得到不同的结果。

请注意，对于位级相同的表示（具有相同的位数），您将获得相同的CRC。即使一个位不同或者额外或更少，您将获得完全不同的CRC。

C zlib crc32和Python zlib crc32不匹配

4 个答案: