我正在尝试使用openmp任务来安排基本jacobi2d计算的平铺执行。在jacobi2d中,依赖于A(i,j)来自
A(i,j)
A(i-1,j)
A(i + 1,j)
A(i,j-1)
A(i,j + 1)。
根据我对depend子句的理解,我正确地声明了依赖关系,但是在执行代码时它们并没有受到尊重。我复制了下面的简化代码片段。最初我的猜测是,某些磁贴的超出范围可能会导致此问题,所以我更正了但问题仍然存在。(我没有复制更长的代码和更正的磁贴范围,因为该部分只是一堆ifs +最大值)
int n=8,tsteps=2,b=4; //n - size of matrix, tsteps - time iterations, b - tile size or block size
#pragma omp parallel
{
#pragma omp master
for (t=0; t<tsteps; ++t)
{
for (i=0; i<n; i+=b)
for (j=0; j<n; j+=b)
{
#pragma omp task firstprivate(t,i,j) depend(in:A[i-1:b+2][j-1:b+2]) depend(out:B[i:b][j:b])
{
#pragma omp critical
printf("t-%d i-%d j-%d --A",t,i,j); //Prints out time loop, i,j
}
}
for (i=0; i<n; i+=b)
for (j=0; j<n; j+=b)
{
#pragma omp task firstprivate(t,i,j) depend(in:B[i-1:b+2][j-1:b+2]) depend(out:A[i:b][j:b])
{
#pragma omp critical
printf("t-%d i-%d j-%d --B",t,i,j); //Prints out time loop, i,j
}
}
}
}
}
因此,从i-1和j-1开始依赖并且范围为(b + 2)的想法是相邻的tile也会影响当前的tile计算。类似地,对于第二组循环,其中A中的值只应在相邻切片使用了值时被覆盖。
正在使用支持openmp 4.0的gcc 5.3编译代码。
ps:上面声明的数组范围表示起始位置和创建依赖图时要考虑的索引数。
编辑(基于Zulan的评论) - 将内部代码更改为简单的print语句,因为这足以检查任务执行的顺序。理想情况下,对于上述值(因为只有4个图块),所有图块应该完成第一个printf,然后只执行第二个。但是如果你执行代码,它会混合订单。
答案 0 :(得分:1)
所以我终于找到了问题,尽管OpenMP规范说依赖子句应该用起点和范围来实现,但它还没有在gcc中实现。因此,目前它只比较了来自depend子句的起点(依赖(在:[[[1:1 + b + 2] [j-1:b + 2]中))A [i-1] [j-1]这个案例。
最初我在比较不同相对平铺位置的元素。例如,将(0,0)元素与tile的最后一个元素进行比较,这与依赖性没有冲突,因此执行各种任务的随机顺序。
当前的gcc实现根本不关心该子句中提供的范围。