我在使用lldb
调试MPI应用程序时遇到问题。基本上,我通过
mpirun_lldb() {
mpirun --mca orte_base_help_aggregate 0 --mca mpi_abort_print_stack 1 -np $1 xterm -hold -e lldb -f $2 -- "${@:3}"
}
但在某些时候MPI_Abort
发生了,并且所有xterm
窗口都被立即关闭,我甚至无法读取堆栈,单独调试并检查变量:
MPI_ABORT was invoked on rank 2 in communicator MPI_COMM_WORLD
with errorcode 255.
NOTE: invoking MPI_ABORT causes Open MPI to kill all MPI processes.
You may or may not see output from other processes, depending on
exactly when Open MPI kills them.
我尝试将-hold
用于xterm
,但这没有用。
P.S。我无法访问像TotalView这样的许可调试器。这是我第一次遇到上述简单方法的问题。
答案 0 :(得分:0)
对不起噪音,添加断点b MPI_Abort
解决了这个问题。