openmp中的Depend子句不尊重声​​明的依赖

时间:2016-03-31 01:29:25

标签: openmp

我正在尝试使用openmp任务来安排基本jacobi2d计算的平铺执行。在jacobi2d中,依赖于A(i,j)来自

A(i,j)
A(i-1,j)
A(i + 1,j)
A(i,j-1)
A(i,j + 1)。

根据我对depend子句的理解,我正确地声明了依赖关系,但是在执行代码时它们并没有受到尊重。我复制了下面的简化代码片段。最初我的猜测是,某些磁贴的超出范围可能会导致此问题,所以我更正了但问题仍然存在。(我没有复制更长的代码和更正的磁贴范围,因为该部分只是一堆ifs +最大值)

int n=8,tsteps=2,b=4;         //n - size of matrix, tsteps - time iterations, b - tile size or block size

#pragma omp parallel
{
#pragma omp master
for (t=0; t<tsteps; ++t)
  {
    for (i=0; i<n; i+=b)
      for (j=0; j<n; j+=b)
      {
        #pragma omp task firstprivate(t,i,j) depend(in:A[i-1:b+2][j-1:b+2]) depend(out:B[i:b][j:b])
        { 
          #pragma omp critical  
          printf("t-%d i-%d j-%d --A",t,i,j);     //Prints out time loop, i,j 
        }
      } 
    for (i=0; i<n; i+=b)
      for (j=0; j<n; j+=b)
      {
        #pragma omp task firstprivate(t,i,j) depend(in:B[i-1:b+2][j-1:b+2]) depend(out:A[i:b][j:b])
        {
          #pragma omp critical  
          printf("t-%d i-%d j-%d --B",t,i,j);     //Prints out time loop, i,j 
        }
      }
  }
}
}

因此,从i-1和j-1开始依赖并且范围为(b + 2)的想法是相邻的tile也会影响当前的tile计算。类似地,对于第二组循环,其中A中的值只应在相邻切片使用了值时被覆盖。

正在使用支持openmp 4.0的gcc 5.3编译代码。

ps:上面声明的数组范围表示起始位置和创建依赖图时要考虑的索引数。

编辑(基于Zulan的评论) - 将内部代码更改为简单的print语句,因为这足以检查任务执行的顺序。理想情况下,对于上述值(因为只有4个图块),所有图块应该完成第一个printf,然后只执行第二个。但是如果你执行代码,它会混合订单。

1 个答案:

答案 0 :(得分:1)

所以我终于找到了问题,尽管OpenMP规范说依赖子句应该用起点和范围来实现,但它还没有在gcc中实现。因此,目前它只比较了来自depend子句的起点(依赖(在:[[[1:1 + b + 2] [j-1:b + 2]中))A [i-1] [j-1]这个案例。

最初我在比较不同相对平铺位置的元素。例如,将(0,0)元素与tile的最后一个元素进行比较,这与依赖性没有冲突,因此执行各种任务的随机顺序。

当前的gcc实现根本不关心该子句中提供的范围。