Question

我试图从浮点数中提取位而不调用未定义的行为。这是我的第一次尝试：

unsigned foo(float x)
{
    unsigned* u = (unsigned*)&x;
    return *u;
}

据我了解，由于严格的别名规则，这不能保证正常工作，对吧？如果使用字符指针进行中间步骤，它是否有效？

unsigned bar(float x)
{
    char* c = (char*)&x;
    unsigned* u = (unsigned*)c;
    return *u;
}

或者我是否必须自己提取单个字节？

unsigned baz(float x)
{
    unsigned char* c = (unsigned char*)&x;
    return c[0] | c[1] << 8 | c[2] << 16 | c[3] << 24;
}

当然这有一个缺点，取决于字节顺序，但我可以忍受。

工会黑客肯定是未定义的行为，对吗？

unsigned uni(float x)
{
    union { float f; unsigned u; };
    f = x;
    return u;
}

为了完整起见，这是foo的参考版本。还有未定义的行为，对吧？

unsigned ref(float x)
{
    return (unsigned&)x;
}

那么，是否可以从浮点数中提取位（假设两者都是32位宽，当然）？

编辑：这是Goz提出的memcpy版本。由于许多编译器还不支持static_assert，我已将static_assert替换为一些模板元编程：

template <bool, typename T>
struct requirement;

template <typename T>
struct requirement<true, T>
{
    typedef T type;
};

unsigned bits(float x)
{
    requirement<sizeof(unsigned)==sizeof(float), unsigned>::type u;
    memcpy(&u, &x, sizeof u);
    return u;
}

Answer 1

关于真正避免任何问题的唯一方法是记忆。

unsigned int FloatToInt( float f )
{
   static_assert( sizeof( float ) == sizeof( unsigned int ), "Sizes must match" );
   unsigned int ret;
   memcpy( &ret, &f, sizeof( float ) );
   return ret;
}

因为你要记忆固定的数量，编译器会优化它。

那说联合方法得到了广泛的支持。

Answer 2

工会黑客肯定是未定义的行为，对吗？

是和否。根据标准，它绝对是未定义的行为。但它是GCC和MSVC这样一个常用的技巧，据我所知，每个其他流行的编译器都明确保证它是安全的并且可以按预期工作。

Answer 3

以下内容未违反别名规则，因为它没有使用lvalues访问不同类型的任何地方

template<typename B, typename A>
B noalias_cast(A a) { 
  union N { 
    A a; 
    B b; 
    N(A a):a(a) { }
  };
  return N(a).b;
}

unsigned bar(float x) {
  return noalias_cast<unsigned>(x);
}

Answer 4

如果您真的想要了解浮点类型的大小并且只返回原始位，请执行以下操作：

void float_to_bytes(char *buffer, float f) {
    union {
        float x;
        char b[sizeof(float)];
    };

    x = f;
    memcpy(buffer, b, sizeof(float));
}

然后这样称呼它：

float a = 12345.6789;
char buffer[sizeof(float)];

float_to_bytes(buffer, a);

当然，这种技术会产生特定于机器字节排序的输出。

浮点和严格别名

4 个答案: