输出精度高于双精度

时间:2011-09-30 14:12:05

标签: c++ double-precision floating-point-precision long-double paraview

我正在打印一些来自C ++程序的数​​据,以便由ParaView处理/可视化,但我遇到了浮点数的问题。 Paraview支持Float32和Float64数据类型。 Float64相当于两倍,典型限制为+/- 1.7e +/- 308。但是,我的代码是打印数字,如6.5e-318。这是在读取数据时抛出ParaView中的错误。我已经验证将这些小数字舍入为零会使ParaView中的错误消失。我不知道为什么我有这样的“高精度”输出,可能是因为有些数字的存储精度高于double。例如,以下代码在我的系统上重现了相同的行为:

#include <iostream>
int main(void)
{
  const double var1 = 1.0e-318, var2 = 1.5e-318;
  std::cout << 1.0e-318 << std::endl; 
  std::cout << var1 << std::endl; 
  std::cout << var1 - var2 << std::endl; 
  std::cout.setf(std::ios_base::fixed | std::ios_base::scientific, std::ios_base::floatfield);
  std::cout << 1.0e-318 << std::endl; 
  std::cout << var1 << std::endl; 
  std::cout << var1 - var2 << std::endl; 

  return 0;
}

我的输出是:

9.99999e-319
9.99999e-319
-4.99999e-319
9.99999e-319
9.99999e-319
-4.99999e-319

我的系统是Mac OS X Snow Leopard,我用GCC 4.2和GCC 4.6测试了上面的标志-m32-m64-ffloat-store(不确定这是否有用)。

实际上我的输出很好,但对于ParaView则没有。我只是想知道为什么我有这个区别。我很可能忽略了与浮点数相关的东西,这可能很重要。请问你能给我一些关于双打输出/数值行为的线索吗?

1 个答案:

答案 0 :(得分:11)

次正规数,即分数中具有最小可能指数和前导零的数字can be smaller than 1E-308, down to 1E-324。您可以使用std :: numeric_limits过滤掉它们。