我当前正在使用AVX2,并且遇到以下问题:
在执行了一些AVX指令后,我必须提取所有值并将它们放入数组中,问题是我发现这样做根本没有效率...
我做了以下事情:
uint32_t temp[];
__m256i x, y;
temp[0] = _mm256_extract_epi32(x, 0);
temp[1] = _mm256_extract_epi32(x, 1);
temp[2] = _mm256_extract_epi32(x, 2);
temp[3] = _mm256_extract_epi32(x, 3);
temp[4] = _mm256_extract_epi32(x, 4);
temp[5] = _mm256_extract_epi32(x, 5);
temp[6] = _mm256_extract_epi32(x, 6);
temp[7] = _mm256_extract_epi32(x, 7);
有没有更好的方法?
谢谢。