我想用omp simd
向量化一个双for循环。我的问题是以下形式:
#include <vector>
using namespace std;
#define N 8000
int main() {
vector<int> a;
vector<int> b;
vector<int> c;
a.resize(N);
b.resize(N);
c.resize(N);
#pragma omp simd collapse(2)
for (unsigned int i = 0; i < c.size(); ++i) {
for (unsigned int j = 0; j < c.size(); ++j) {
c[i] += a[i] + b[j];
}
}
}
当我使用g++ -O2 -fopenmp-simd -fopt-info-vec-all
编译时,矢量化报告指出:
note: not vectorized: not suitable for gather load _14 = *_42;
如何转换代码以便编译器自动对其进行矢量化?
(编译器:g++ 5.4.0
,CPU支持AVX2
)
更新
如下所述,主要问题是c
的数据依赖性,其中只有内部循环似乎是可矢量化的。解决依赖关系,可以通过切换循环来实现,如下所示。编译器现在为我自动矢量化了。
for (unsigned int j = 0; j < c.size(); ++j) {
#pragma omp simd
for (unsigned int i = 0; i < c.size(); ++i) {
c[i] += a[i] + b[j];
}
}
答案 0 :(得分:1)
代码的主要问题是循环迭代计数在执行循环之前无法计算。您需要将 c.size()替换为 N 。
第二个问题是如果你想要矢量化外循环, c [i] = a [i] + b [j] 的陈述导致流和反依赖项。为了解决这些问题,我尝试向量化内部循环,我的代码成功地进行了向量化。
您可以在下面的页面中阅读有关Anti和Flow Dependencies的更多信息: https://en.wikipedia.org/wiki/Data_dependency
矢量化后我达到6.3加速。 最后我的代码如下所示:
for (unsigned int i = 0; i < N; ++i)
{
#pragma simd
for (unsigned int j = 0; j < N; ++j)
{
c[i] = a[i] + b[j];
}
}