缺少RDMA是网络问题的原因(source1,source2),例如ifconfig显示eth1-avahi(参见link)?我想在两个A8节点上运行OpenFOAM并且必须执行
/etc/init.d/networking restart
经常只启用eth0。否则mpi使用错误的IP地址进行通信,例如169 ...,而不是10 .....
$bash> ifconfig
eth0 Link encap:Ethernet HWaddr 00:0d:3a:20:3f:33
inet addr:10.0.0.4 Bcast:10.0.1.255 Mask:255.255.254.0
eth1 Link encap:Ethernet HWaddr 00:15:5d:33:ff:ad
inet6 addr: fe80::215:5dff:fe33:ffad/64 Scope:Link
eth1:avahi Link encap:Ethernet HWaddr 00:15:5d:33:ff:ad
inet addr:169.254.9.198 Bcast:169.254.255.255 Mask:255.255.0.0
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
如果我使用Infiniband运行mpirun,如下所示:
mpirun --host localhost --mca btl openib,self,tcp -np $ nProcs
虚拟机上真的是Infiniband吗?