Question

引用用于计算整数绝对值（abs）的代码而不分支http://graphics.stanford.edu/~seander/bithacks.html：

int v;           // we want to find the absolute value of v
unsigned int r;  // the result goes here 
int const mask = v >> sizeof(int) * CHAR_BIT - 1;

r = (v + mask) ^ mask;

专利变体：

r = (v ^ mask) - mask;

什么是CHAR_BIT以及如何使用它？

Answer 1

CHAR_BIT是char中的位数。目前，几乎所有架构每字节使用8位，但并非总是如此。一些旧机器曾经有7位字节。

可以在<limits.h>找到。

Answer 2

您应该知道此代码取决于已签名类型的右位移的实现定义行为。 gcc承诺始终提供理智的行为（符号位扩展），但ISO C允许实现零填充高位。

解决此问题的一种方法：

#ifdef HAVE_SIGN_EXTENDING_BITSHIFT
int const mask = v >> sizeof(int) * CHAR_BIT - 1;
#else
int const mask = -((unsigned)v >> sizeof(int) * CHAR_BIT - 1);
#endif

您的Makefile或config.h等可以在构建时定义HAVE_SIGN_EXTENDING_BITSHIFT，具体取决于您的平台。

Answer 3

尝试在原始问题中回答显式问题（什么是CHAR_BIT）和隐含问题（这是如何工作的）。

C和C ++中的char表示C程序可以解决的最小内存单元*

C和C ++中的CHAR_BIT表示char中的位数。由于char类型的其他要求，它必须始终至少为8。在所有现代通用计算机的实践中，它恰好是8，但是一些历史或专业系统可能具有更高的值。

Java没有CHAR_BIT或sizeof，因此不需要它，因为Java中的所有基本类型都是固定大小，并且对象的内部结构对程序员来说是不透明的。如果将此代码转换为Java，您只需将“sizeof（int）* CHAR_BIT - 1”替换为固定值31。

在此特定代码中，它用于计算int中的位数。请注意，此计算假定int类型不包含任何填充位。

假设您的编译器选择对有符号数的位移进行符号扩展，并假设您的系统使用2s补码表示负数，这意味着“MASK”对于正值或零值将为0，对于负值则为-1

要取消二进制补码数，我们需要按位执行，然后再添加一个。等价地，我们可以减去一个然后按位否定它。

再次假设二进制补码表示-1由全1表示，所以异或或-1与按位否定相等。

因此，当v为零时，数字保持不变，当v为1时，它被否定。

需要注意的是C和C ++中的签名溢出是未定义的行为。因此，对最负面的值使用此ABS实现会导致未定义的行为。这可以通过添加强制转换来修复，以便在unsigned int中计算程序的最后一行。

*这通常与硬件可以解决的最小内存单位相同，但并非相同。实现可以将多个硬件可寻址存储器单元组合成一个程序可寻址存储器单元，或者将一个硬件可寻址存储器单元分成多个程序可存储存储器单元。

什么是CHAR_BIT？

3 个答案: