我们遇到动态库中浮点精度的问题。
设置如下:
可执行文件和库都是用C ++编写的,并使用相同的GCC编译器版本在同一台机器上编译。该库只使用与可执行文件A相同的编译器设置编译一次,但可执行文件B的编译器设置可能不同。
当使用相同的库时,我们期望在提供相同输入时两个可执行文件具有相同的计算精度。看起来库的浮点精度受外部因素的影响,例如:处理特定配置。
这是可能的吗?如果是这样,怎样才能确保我们在两次运行中获得相同的精度(程序A和B)?
修改1
我成功地创建了一个演示差异的最小例子。如果我在库中使用以下代码(比如计算X),则两次运行(A和B)的结果都不同:
float* value = new float;
*value = 2857.0f;
std::cout << std::setprecision(15) << std::log(*value) << std::endl;
我还以二进制格式打印了浮点数,它们显示了最后一位的差异。
不幸的是无法控制可执行文件A的整个构建链。实际上A是一个动态库,它是从另一个我无法控制的可执行文件中使用的,也不知道编译器选项。
我尝试在可执行文件B上使用许多不同的优化编译器选项来查看是否可以获得与可执行文件A相同的结果,但直到现在这并没有解决问题。
修改2
上面代码的汇编输出是:
.LFB1066:
.cfi_startproc
.cfi_personality 0x9b,DW.ref.__gxx_personality_v0
push rbp #
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
push rbx #
.cfi_def_cfa_offset 24
.cfi_offset 3, -24
sub rsp, 8 #,
.cfi_def_cfa_offset 32
mov edi, 4 #,
call _Znwm@PLT #
mov DWORD PTR [rax], 0x45329000 #* D.23338,
mov rdi, QWORD PTR _ZSt4cout@GOTPCREL[rip] # tmp66,
mov rax, QWORD PTR [rdi] # cout._vptr.basic_ostream, cout._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp68,
mov QWORD PTR 8[rax+rdi], 15 # <variable>._M_precision,
movsd xmm0, QWORD PTR .LC1[rip] #,
call _ZNSo9_M_insertIdEERSoT_@PLT #
mov rbx, rax # D.23465,
mov rax, QWORD PTR [rax] # <variable>._vptr.basic_ostream, <variable>._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp73,
mov rbp, QWORD PTR 240[rbx+rax] # D.23552, <variable>._M_ctype
test rbp, rbp # D.23552
je .L9 #,
cmp BYTE PTR 56[rbp], 0 # <variable>._M_widen_ok
je .L5 #,
movsx esi, BYTE PTR 67[rbp] # D.23550, <variable>._M_widen
编辑3
正如评论中所建议的那样,我在库中打印了浮点舍入模式和SSE状态信息。
对于两次运行(可执行文件A和B),我得到相同的值:
答案 0 :(得分:1)
您的问题的答案是:是的,原则上,流程可以更改代码运行的浮点上下文。
关于您的特定代码和值:
舍入模式(如Matteo建议的那样)可能影响字符串格式,因为它重复除以10 - 但我无法使用std::fesetround
重现问题。
我也无法看到它会如何影响您所说的不同的位模式。汇编代码显示文字0x45329000
,相当于2857.0,文字本身不能被浮点env改变。