在Cray XC30上运行VASP 5.3.5时出错

时间:2015-06-01 14:11:51

标签: mpi cray

在Cray XC30上运行VASP 5.3.5时,我看到以下错误:

Rank 4 [Mon Jun  1 14:58:35 2015] [c1-0c0s2n0] Fatal error in PMPI_Allgatherv:  Invalid buffer pointer, error stack:
PMPI_Allgatherv(1235): MPI_Allgatherv(sbuf=0x49ead730, scount=1536,  MPI_DOUBLE_COMPLEX, rbuf=0x49e95730, rcounts=0x494cdba0, displs=0x494d7360, 
MPI_DOUBLE_COMPLEX, comm=0x84000007) failed
PMPI_Allgatherv(1183): Buffers must not be aliased. Consider using MPI_IN_PLACE or setting MPICH_NO_BUFFER_ALIAS_CHECK

6个月前编译的可执行文件不存在。任何想法在这里发生了什么?

我正在使用GCC 4.9.2与Cray MPICH2 7.1.1,Cray LibSci 13.0.1和FFTW 3.3.4.1。

1 个答案:

答案 0 :(得分:3)

这是由于MPICH2库中的更改现在严格执行MPI集合中的非重叠缓冲区。

理想情况下,应修改代码,使其符合MPI标准,方法是修改调用以使缓冲区不重叠,或者在MPI调用中指定MPI_IN_PLACE。

但是,您可以通过设置恢复与以前版本的Cray MPICH2相同的行为:

export MPICH_NO_BUFFER_ALIAS_CHECK=1

在运行代码之前(在bash中,通常在aprun调用VASP之前在作业提交脚本中执行此操作)。

注意此问题也出现在VASP 4以及VASP 5中。