我在Azure上购买了1台H16r虚拟机,并在“About H-series and compute-intensive A-series VMs”上尝试了RDMA的设置方法:
azure config mode arm
azure vm extension set <resource-group> <vm-name> RDMAUpdateForLinux Microsoft.OSTCExtensions 0.1
正如azure官方介绍:“此界面允许支持RDMA的实例通过 InfiniBand 网络相互通信,以 FDR 的速率运行 H16r和H16mr虚拟机,以及A8和A9虚拟机的QDR速率。“
所以使用Infiniband技术的H16r味道是正确的,但是在azure-cli安装了rdma驱动程序后,我仍然无法在H16 VM中找到IB接口!
答案 0 :(得分:0)
如果您不能进行 RDMA,那它就不是“支持 RDMA”的设备!
在其他 H 系列 (H[bc]*r*) 上,您有一个 ib0 接口,并且 Mellanox 通过 SR-IOV 接口暴露在总线中,但对于 H16r,您没有:
NR_14-22:58:03 ~ $ ifconfig ib0
ib0: error fetching interface
information: Device not found
NR_14-22:58:43 ~ $ lsmod | grep rdma
NR_14-22:58:57 ~ $ lspci | grep Mell
<块引用>
在这些用于未启用 SR-IOV 的 VM 的基于 CentOS 的 HPC 映像上,yum 配置文件中禁用了内核更新。这是因为 NetworkDirect Linux RDMA 驱动程序是作为 RPM 包分发的,如果内核更新,驱动程序更新可能不起作用。
...但是没有这样的“NetworkDirect”Linux 驱动程序。