为什么即使是16字节对齐的地址也会导致_mm_load_si128导致访问冲突?

时间:2014-04-05 12:59:25

标签: c++ sse intrinsics

以下编译在MSVC上没有警告。

#include <iostream>
#include <emmintrin.h>

int main() 
{
    __declspec(align(16)) int x = 42;
    std::cout << &x << "\n";  // Print out the address that holds x

    __m128i v = _mm_load_si128((__m128i const*)(x));
}

本质上,代码对齐一个32位整数,并尝试将其加载到__m128i类型中。 _mm_load_si128 要求输入地址为16字节对齐。 _mm_loadu_si128不需要它,但两者都会导致上面的代码在运行时发出访问冲突。为什么,我该如何解决?

1 个答案:

答案 0 :(得分:5)

您忘记了x的地址:

__m128i v = _mm_load_si128((__m128i const*)(&x));
//                                          ^
//                                          |
//                     Here ----------------+

此外,您没有为数据提供足够的空间,因此_mm_load_si128将最终读取已分配的内存块的末尾。