我仍然很擅长使用SSE并尝试为2*Pi
的双精度输入实现1e8
的模数(其结果将被输入到某些矢量化的trig中)计算)。
我目前对代码的尝试基于mod(x, 2*Pi) = x - floor(x/(2*Pi))*2*Pi
看起来像这样的想法:
#define _PD_CONST(Name, Val) \
static const double _pd_##Name[2] __attribute__((aligned(16))) = { Val, Val }
_PD_CONST(2Pi, 6.283185307179586); /* = 2*pi */
_PD_CONST(recip_2Pi, 0.159154943091895); /* = 1/(2*pi) */
void vec_mod_2pi(const double * vec, int Size, double * modAns)
{
__m128d sse_a, sse_b, sse_c;
int i;
int k = 0;
double t = 0;
unsigned int initial_mode;
initial_mode = _MM_GET_ROUNDING_MODE();
_MM_SET_ROUNDING_MODE(_MM_ROUND_DOWN);
for (i = 0; i < Size; i += 2)
{
sse_a = _mm_loadu_pd(vec+i);
sse_b = _mm_mul_pd( _mm_cvtepi32_pd( _mm_cvtpd_epi32( _mm_mul_pd(sse_a, *(__m128d*)_pd_recip_2Pi) ) ), *(__m128d*)_pd_2Pi);
sse_c = _mm_sub_pd(sse_a, sse_b);
_mm_storeu_pd(modAns+i,sse_c);
}
k = i-2;
for (i = 0; i < Size%2; i++)
{
t = (double)((int)(vec[k+i] * 0.159154943091895)) * 6.283185307179586;
modAns[k+i] = vec[k+i] - t;
}
_MM_SET_ROUNDING_MODE(initial_mode);
}
不幸的是,目前很多NaN
都会返回1.128e119
的几个答案(有些超出0
- &gt; 2*Pi
的范围我的目标是!)。我怀疑我出错的地方在于我试图用floor
进行的双对二转换。
有人能说出我出错的地方以及如何改进吗?
P.S。对于该代码的格式感到抱歉,这是我第一次在这里发布一个问题而且似乎无法让它在代码块中给我空行以使其可读。
答案 0 :(得分:7)
如果你想要任何精确度,简单的算法非常糟糕。有关精确范围缩减算法,请参阅例如Ng et al., ARGUMENT REDUCTION FOR HUGE ARGUMENTS: Good to the Last Bit(现已通过Wayback Machine提供:2012-12-24)
答案 1 :(得分:1)
对于大型参数,通常使用Hayne-Panek algorithm。但是,Hayne-Panek的论文很难阅读,我建议您查看Chapter 11 in the Handbook of Floating-Point Arithmetic以获得更容易理解的解释。