我有以下代码,它只是两个向量:
void AddXor256(uint8_t *resBuf, uint8_t *buf1, uint8_t *buf2) {
__m256i res, a, b;
a = _mm256_lddqu_si256 ((__m256i const *)buf1);
b = _mm256_lddqu_si256 ((__m256i const *)buf2);
res = _mm256_xor_si256 (a,b);
_mm256_storeu_si256 ((__m256i *)resBuf, res);
}
相同的代码,但使用128位内在函数工作正常。但是当我尝试使用256位内在函数时,我收到以下错误:
Illegal instruction
这可能是什么问题?