为什么访问threadprivate变量会导致分段错误?

时间:2019-06-06 15:09:12

标签: fortran segmentation-fault openmp

我正在修改使用openmp库的现有Fortran代码。该代码的原始版本可完美并行运行。

在多线程运行期间访问某个变量时,我遇到了段错误(我通过在代码中设置所有标志来验证)。该数组定义为可分配的,然后定义为threadprivate然后分配,而在原始版本中,它不是可分配的,并且其大小会立即设置。由于得到了我的工作计划,我修改了这部分。

这是重现错误的基本代码。有罪的变量是一个名为“ var”的数组。

program testparallel
  use omp_lib
  implicit none
  integer :: thread_id, thread_num
  integer :: i,N
  integer,dimension(:),allocatable,save :: var

  !$omp threadprivate(var)

  N = 20
  allocate(var(5))

  !$omp parallel default(shared) private(thread_id)

  thread_id  = omp_get_thread_num()
  thread_num = omp_get_num_threads()
  write(*,*)'Parallel execution on ',thread_num, ' Threads'

  !$omp do

  do i=1,N
    var = 0
    write(*,*) thread_id,i
  end do

  !$omp end do
  !$omp end parallel

end program testparallel

这或多或少是原始代码的结构形式,我没有直接修改这部分。 var在循环内初始化,根据输入,其值稍后将由其他例程使用。

这是我获得的错误回溯:

 Parallel execution on            2  Threads
           0           1
           0           2
 Parallel execution on            2  Threads
           0           3
           0           4
           0           5

Program received signal SIGSEGV: Segmentation fault - invalid memory reference.
           0           6

Backtrace for this error:
           0           7
           0           8
           0           9
           0          10
#0  0x7F0149194697
#1  0x7F0149194CDE
#2  0x7F014824E33F
#3  0x400FB2 in MAIN__._omp_fn.0 at testparallel.F90:?
#4  0x7F0148C693C4
#5  0x7F01485ECDD4
#6  0x7F0148315F6C
#7  0xFFFFFFFFFFFFFFFF

如果我没有将var定义为可分配的,而是直接定义var的大小,则不会发生段错误(如原始代码所示)。如果我在将其设置为threadprivate之前分配了它,则会出现编译错误。

如何避免此错误,但将var保持可分配状态(这是必需的)?

编辑:我更正了原始代码的描述。

1 个答案:

答案 0 :(得分:3)

您的问题来自以下事实:尽管您可分配的数组var被声明为threadprivate,但它仅分配在代码的非并行部分中。因此,一旦进入并行段,只有主线程才能安全地访问该数组。

一个非常简单的解决方法是将数组分配(以及随后的取消分配)封装在parallel部分中,如下所示:

!$omp parallel
allocate(var(5))
!$omp end parallel