浮点和严格别名

时间:2010-12-01 19:40:16

标签: c++ floating-point bits strict-aliasing type-punning

我试图从浮点数中提取位而不调用未定义的行为。这是我的第一次尝试:

unsigned foo(float x)
{
    unsigned* u = (unsigned*)&x;
    return *u;
}

据我了解,由于严格的别名规则,这不能保证正常工作,对吧?如果使用字符指针进行中间步骤,它是否有效?

unsigned bar(float x)
{
    char* c = (char*)&x;
    unsigned* u = (unsigned*)c;
    return *u;
}

或者我是否必须自己提取单个字节?

unsigned baz(float x)
{
    unsigned char* c = (unsigned char*)&x;
    return c[0] | c[1] << 8 | c[2] << 16 | c[3] << 24;
}

当然这有一个缺点,取决于字节顺序,但我可以忍受。

工会黑客肯定是未定义的行为,对吗?

unsigned uni(float x)
{
    union { float f; unsigned u; };
    f = x;
    return u;
}

为了完整起见,这是foo的参考版本。还有未定义的行为,对吧?

unsigned ref(float x)
{
    return (unsigned&)x;
}

那么,是否可以从浮点数中提取位(假设两者都是32位宽,当然)?


编辑:这是Goz提出的memcpy版本。由于许多编译器还不支持static_assert,我已将static_assert替换为一些模板元编程:

template <bool, typename T>
struct requirement;

template <typename T>
struct requirement<true, T>
{
    typedef T type;
};

unsigned bits(float x)
{
    requirement<sizeof(unsigned)==sizeof(float), unsigned>::type u;
    memcpy(&u, &x, sizeof u);
    return u;
}

4 个答案:

答案 0 :(得分:16)

关于真正避免任何问题的唯一方法是记忆。

unsigned int FloatToInt( float f )
{
   static_assert( sizeof( float ) == sizeof( unsigned int ), "Sizes must match" );
   unsigned int ret;
   memcpy( &ret, &f, sizeof( float ) );
   return ret;
}

因为你要记忆固定的数量,编译器会优化它。

那说联合方法得到了广泛的支持。

答案 1 :(得分:6)

  

工会黑客肯定是未定义的行为,对吗?

是和否。根据标准,它绝对是未定义的行为。但它是GCC和MSVC这样一个常用的技巧,据我所知,每个其他流行的编译器都明确保证它是安全的并且可以按预期工作。

答案 2 :(得分:5)

以下内容未违反别名规则,因为它没有使用lvalues访问不同类型的任何地方

template<typename B, typename A>
B noalias_cast(A a) { 
  union N { 
    A a; 
    B b; 
    N(A a):a(a) { }
  };
  return N(a).b;
}

unsigned bar(float x) {
  return noalias_cast<unsigned>(x);
}

答案 3 :(得分:0)

如果您真的想要了解浮点类型的大小并且只返回原始位,请执行以下操作:

void float_to_bytes(char *buffer, float f) {
    union {
        float x;
        char b[sizeof(float)];
    };

    x = f;
    memcpy(buffer, b, sizeof(float));
}

然后这样称呼它:

float a = 12345.6789;
char buffer[sizeof(float)];

float_to_bytes(buffer, a);

当然,这种技术会产生特定于机器字节排序的输出。