在Cray XC30上运行VASP 5.3.5时,我看到以下错误:
Rank 4 [Mon Jun 1 14:58:35 2015] [c1-0c0s2n0] Fatal error in PMPI_Allgatherv: Invalid buffer pointer, error stack:
PMPI_Allgatherv(1235): MPI_Allgatherv(sbuf=0x49ead730, scount=1536, MPI_DOUBLE_COMPLEX, rbuf=0x49e95730, rcounts=0x494cdba0, displs=0x494d7360,
MPI_DOUBLE_COMPLEX, comm=0x84000007) failed
PMPI_Allgatherv(1183): Buffers must not be aliased. Consider using MPI_IN_PLACE or setting MPICH_NO_BUFFER_ALIAS_CHECK
6个月前编译的可执行文件不存在。任何想法在这里发生了什么?
我正在使用GCC 4.9.2与Cray MPICH2 7.1.1,Cray LibSci 13.0.1和FFTW 3.3.4.1。
答案 0 :(得分:3)
这是由于MPICH2库中的更改现在严格执行MPI集合中的非重叠缓冲区。
理想情况下,应修改代码,使其符合MPI标准,方法是修改调用以使缓冲区不重叠,或者在MPI调用中指定MPI_IN_PLACE。
但是,您可以通过设置恢复与以前版本的Cray MPICH2相同的行为:
export MPICH_NO_BUFFER_ALIAS_CHECK=1
在运行代码之前(在bash中,通常在aprun调用VASP之前在作业提交脚本中执行此操作)。
注意此问题也出现在VASP 4以及VASP 5中。