如何实现没有未定义行为的快速逆sqrt?

时间:2014-06-25 09:36:22

标签: c++ undefined-behavior strict-aliasing

根据我对strict aliasing rule的理解,fast inverse square root的此代码将导致C ++中的未定义行为:

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y; // type punning
    i  = 0x5f3759df - ( i >> 1 );
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );

    return y;
}

这段代码确实会导致UB吗?如果是,如何以符合标准的方式重新实现?如果没有,为什么不呢?

假设:在调用此函数之前,我们已经以某种方式检查了浮点数是IEEE 754 32位格式sizeof(long)==sizeof(float),平台是小端。

4 个答案:

答案 0 :(得分:9)

符合标准的方式是std::memcpy。这应该在您指定的假设下符合标准。如果可能的话,任何合理的编译器都会把它变成一堆寄存器移动。此外,我们还可以使用C ++ 11的static_assert和来自<cstdint>的固定宽度整数类型来缓解(或至少检查)您做出的一些假设。无论如何,Endianness是无关紧要的,因为我们不在这里处理任何数组,如果整数类型是little-endian,浮点类型也是。

float Q_rsqrt( float number )
{
    static_assert(std::numeric_limits<float>::is_iec559, 
                  "fast inverse square root requires IEEE-comliant 'float'");
    static_assert(sizeof(float)==sizeof(std::uint32_t), 
                  "fast inverse square root requires 'float' to be 32-bit");
    float x2 = number * 0.5F, y = number;
    std::uint32_t i;
    std::memcpy(&i, &y, sizeof(float));
    i  = 0x5f3759df - ( i >> 1 );
    std::memcpy(&y, &i, sizeof(float));
    return y * ( 1.5F - ( x2 * y * y ) );
}

答案 1 :(得分:6)

您应该使用memcpy。 AFAIK这是唯一符合标准的方式,编译器足够聪明,可以用单个单词移动指令替换调用。有关这些说法背后的原因,请参阅this question

答案 2 :(得分:4)

我不认为你可以在没有UB的情况下在严格的标准意义上做到这一点,仅仅因为它依赖于诸如floatlong的特定值表示之类的东西。该标准没有具体说明这些(故意),并且给予实施在这方面做他们认为合适的自由,特别是应用&#34; UB&#34;标记所有依赖于此类事物的行为。

这并不意味着这将是&#34; Heisenbug&#34;或者&#34;鼻子恶魔&#34; UB的类型;最有可能的是,实现将提供此行为的定义。只要这些定义满足代码的前提条件,它就没问题。这里的先决条件是:

  • 实施允许类型惩罚。
  • sizeof(float) == sizeof(long)
  • float的内部表示是这样的:如果这些位被解释为long,则0x5f3759df>> 1具有该hack运行所需的含义。< / LI>

但是,不可能以完全可移植的方式重写(即没有UB) - 例如,对于使用不同浮点运算实现的平台,您会怎么做?只要您依赖特定平台的具体细节,您就依赖于标准中未定义但由平台定义的行为。

答案 3 :(得分:3)

不。该算法首先假设IEEE754布局,这不是符合标准的有效假设。对于任何其他布局,特定常量0x5f3759df将完全错误。甚至假设存在这样的常数也是有缺陷的。例如,我认为一旦你颠倒了浮动内部字段的顺序,它就会中断。

即使假设IEEE754,我也不确定Q_rsqrt(-0.0f)是否正常工作。两个零(正数和负数)应该相等,sqrt(x)仅为x<-0.0f

未定义