我有以下代码(手册版本来自Adler的answer)
#include <iostream>
#include <nmmintrin.h>
#define POLY2 0x82f63b78
uint32_t crc32c2(uint32_t crc, const unsigned char *buf, size_t len)
{
int k;
crc = ~crc;
while (len--) {
crc ^= *buf++;
for (k = 0; k < 8; k++)
crc = crc & 1 ? (crc >> 1) ^ POLY2 : crc >> 1;
}
return ~crc;
}
int main(int argc, char **argv)
{
const unsigned int val = 5;
std::cout << std::hex << crc32c2(0,(const unsigned char*)&val,4) << std::endl;
std::cout << _mm_crc32_u32(0, 5) << std::endl;
}
输出是:
ee00d08c
a6679b4b
我的问题是为什么手册版本没有给出与内在相同的答案。
答案 0 :(得分:4)
Mark Adler对Implementing SSE 4.2's CRC32C in software的回答表明,您需要以0 ^ 0xffffffff
开头,并以crc0 ^ 0xffffffff;
结束前后处理。 (或者像在SW版本中那样使用~
运算符。)
Mark的答案使用GNU C inline asm,但内在端口很简单。 (它使用多个累加器展开以隐藏crc32_u64
在大缓冲区上的延迟。)
此版本适用于我的系统。
int main(int argc, char **argv)
{
const unsigned int val = 5;
std::cout << std::hex << crc32c2(0,(const unsigned char*)&val,4) << '\n';
std::cout << (_mm_crc32_u32(0^0xffffffff, 5) ^ 0xffffffffU) << '\n';
}
(注意std::endl
比新行慢一点,除非你真的需要强制刷新以防流完全缓冲而不是行缓冲。)