从值可以推断出它使用与双精度浮点硬件相同的组件。但是double有53位的尾数,为什么AVX512-IFMA限制在52位?
答案 0 :(得分:4)
IEEE-754 double precision实际上只有52个显式存储位,第53位(最高位)是隐式1。
答案 1 :(得分:0)
它利用DPF算术单元和FMA来实现快速的多精度乘法,有关详细信息,请参见本文的第一部分: Faster Modular Exponentiation Using Double Precision Floating Point Arithmetic on the GPU
如本文所述,由于它是在dpf乘法单元上进行乘法运算的,因此,如果对53个位的操作数进行采样,则会破坏统一的处理步骤。