标签: vectorization simd
我只是想知道SIMD扩展如何使用降序索引在循环中实现向量加载。
例如我们有一个循环 for(i = N; i == 0; i - )
但连续内存是从低地址加载的。在这种情况下,向量加载后跟一个向量shuffle将每个元素放到正确的通道上吗?
提前致谢, Ť