标签: parallel-processing mpi infiniband
我正在运行在集群上完美运行的代码, 当我将内核数增加到3844时,出现以下错误,
“太多重试将消息发送到0x0040:0x00152080,放弃了”
此错误是网络问题吗?还是与代码有关?
不幸的是,我无法在此处发布整个代码
谢谢