实现浮点减法

时间:2009-02-26 15:35:17

标签: floating-point subtraction

我正在尝试实现一个浮点算术库,我无法理解减去浮点数的算法。我已经成功地实现了添加,我认为减法只是它的一个特例,但似乎我在某处犯了一个错误。  我在这里添加代码仅供参考,它有许多自解释功能,但我不希望有人100%理解它。我想要帮助的是算法。我们遵循与添加浮点数相同的方法,除了当我们添加尾数时,我们将负数(我们减去的那个)转换为二进制补码然后加上它们?

这就是我正在做的但是结果不正确。虽然它非常接近......但不一样。有人有什么想法吗?提前谢谢!

我很确定我做事的方式是有效的,因为我实现了一个几乎相同的算法来添加浮动,它就像一个魅力。

_float subFloat(_float f1,_float f2)
{
unsigned char diff;
_float result;

//first see whose exponent is greater
if(f1.float_parts.exponent > f2.float_parts.exponent)
{
    diff = f1.float_parts.exponent - f2.float_parts.exponent;

    //now shift f2's mantissa by the difference of their exponent to the right
    //adding the hidden bit
    f2.float_parts.mantissa = ((f2.float_parts.mantissa)>>1) | (0x01<<22);
    f2.float_parts.mantissa >>= (int)(diff);//was (diff-1)

    //also increase its exponent by the difference shifted
    f2.float_parts.exponent = f2.float_parts.exponent + diff;
}
else if(f1.float_parts.exponent < f2.float_parts.exponent)
{
    diff = f2.float_parts.exponent - f1.float_parts.exponent;
    result = f1;
    f1 = f2;        //swap them
    f2 = result;

    //now shift f2's mantissa by the difference of their exponent to the right
    //adding the hidden bit
    f2.float_parts.mantissa = ((f2.float_parts.mantissa)>>1) | (0x01<<22);
    f2.float_parts.mantissa >>= (int)(diff);

    //also increase its exponent by the difference shifted
    f2.float_parts.exponent = f2.float_parts.exponent + diff;
}
else//if the exponents were equal
  f2.float_parts.mantissa = ((f2.float_parts.mantissa)>>1) | (0x01<<22); //bring out the hidden bit




//getting two's complement of f2 mantissa
f2.float_parts.mantissa ^= 0x7FFFFF;
f2.float_parts.mantissa += 0x01;



result.float_parts.exponent = f1.float_parts.exponent;
result.float_parts.mantissa = (f1.float_parts.mantissa +f2.float_parts.mantissa)>>1;
                                                //gotta shift right by overflow bits

//normalization
if(manBitSet(result,1))
    result.float_parts.mantissa <<= 1;  //hide the hidden bit
else
    result.float_parts.exponent +=1;

return result;

}

2 个答案:

答案 0 :(得分:2)

a-b == a+(-b),一元减号是微不足道的,所以我甚至不打扰二进制减号。

答案 1 :(得分:1)

如果您的加法代码是正确的,而您的减法代码是正确的,那么问题可能在于补码和补充。

是否有必要进行二次补码和加法,而不是减法?

如果这不是问题,我的算法就遇到​​了问题。我做了这样的事情已经有一段时间了。你能提供一些细节吗?更具体地说,什么是隐藏位?

对我来说,隐藏位的处理对于加法而不是减法是合适的。难道你应该把它设置在f1尾数而不是f2吗?或者否定f1尾数而不是f2?

不知道你得到了什么与你期望的一样,以及你正在使用的算法的更多细节,这是我能做的最好的。

编辑:好的,我看了你评论中的引用。您在提供的代码中未能做到的一件事是规范化。添加时,隐藏位溢出(向左移位尾数,递增指数),或者它们不会。当减去时,尾数的任意部分可以为零。在十进制中,考虑添加0.5E1和0.50001E1;你得到1.00001E1,如果你正常化,你会得到0.10001E2。从0.50001E1减去0.5E1时,得到0.00001E1。然后你需要将尾数向左移动,并将指数递减至0.1E-4。