对于包含双浮点指令的STM32F7,我想将uint64_t
转换为double
。
为了测试这一点,我使用了以下代码:
volatile static uint64_t m_testU64 = 45uLL * 0xFFFFFFFFuLL;
volatile static double m_testD;
#ifndef DO_NOT_USE_UL2D
m_testD = (double)m_testU64;
#else
double t = (double)(uint32_t)(m_testU64 >> 32u);
t *= 4294967296.0;
t += (double)(uint32_t)(m_testU64 & 0xFFFFFFFFu);
m_testD = t;
#endif
默认情况下(如果未定义DO_NOT_USE_UL2D
,编译器(gcc或clang)将调用函数:__aeabi_ul2d()
,该函数执行的指令数量复杂。请在此处查看汇编代码:https://github.com/gcc-mirror/gcc/blob/master/libgcc/config/arm/ieee754-df.S#L537
在我的特定示例中,无需输入大多数分支即可花费20条指令
如果定义了DO_NOT_USE_UL2D
,则编译器将生成以下汇编代码:
movw r0, #1728 ; 0x6c0
vldr d2, [pc, #112] ; 0x303fa0
movt r0, #8192 ; 0x2000
vldr s0, [r0, #4]
ldr r1, [r0, #0]
vcvt.f64.u32 d0, s0
vldr s2, [r0]
vcvt.f64.u32 d1, s2
ldr r1, [r0, #4]
vfma.f64 d1, d0, d2
vstr d1, [r0, #8]
代码更简单,只有10条指令。
这里是问题(如果定义了DO_NOT_USE_UL2D
):
__aeabi_ul2d()
函数慢(不是很重要,但有点奇怪)?我必须这样做,因为不允许我使用libgcc中的函数(这样做的理由非常充分……)
请注意,此问题的主要目的不是性能,我对libgcc中的实现真的很好奇,我真的想知道我的代码中是否有错误。