英特尔SIMD内部函数:_mm256_i64scatter_pd

时间:2019-11-11 18:04:33

标签: simd avx2

我在编译英特尔SIMD散点内在函数时遇到麻烦。我已经将原始代码简化为:

double *tmpMemoryDoubles= (double *) malloc(1024);
__m256i tmpRegisterIndex = _mm256_set_epi64x(0, 1, 2, 3);
__m256d tmpRegisterDouble = _mm256_set_pd(0.0, 0.0, 0.0, 0.0);
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);

_mm256_i64scatter_pd()的文档将参数定义为:

void   _mm256_i64scatter_pd (void* base_addr, __m256i vindex, __m256d a, const int scale)

这是错误消息:

/usr/lib/gcc/x86_64-linux-gnu/7/include/avx512vlintrin.h:11152:1: error: inlining failed in call to always_inline 'void _mm256_i64scatter_pd(void*, __m256i, __m256d, int)': target specific option mismatch
_mm256_i64scatter_pd (void *__addr, __m256i __index,
src_avx2/PRE_build_region_impulse_devel_avx2.cpp:631:33: note: called from here
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);

任何人都可以看到我在做什么吗?

1 个答案:

答案 0 :(得分:2)

这不是AVX2指令。如果您使用-march=native进行编译,并且编译器给出了此结果,则您的CPU没有AVX512VL。 AVX2只有聚集。分散是AVX512的新功能。

即使您使用内部函数,GCC和clang都需要启用ISA扩展才能发出这些指令。 (与MSVC和ICC不同)。您可以使用-mavx512vl-march=skylake-avx512进行编译以成功编译,然后在不支持它的CPU上运行时出错。

这就是target specific option mismatch的意思;如果您在inlining failed in call to always_inline和/或target specific option mismatch上进行过Google搜索,那么您会发现很多有关需要-mwhatever的热门信息。

或者,如果您在Intel's intrinsics finder中查找_mm256_i64scatter_pd,则会发现它需要AVX512VL。