标签: memory crash rdma
我的问题很简单:如果机器的CPU / OS出现故障,它的内存是否仍可通过远程机器的远程直接内存访问(RDMA)使用?
答案 0 :(得分:0)
这实际上取决于系统遇到的故障类型。如果操作系统出现故障,实施RDMA的HCA可能会代表远程请求继续执行DMA。虽然在没有操作系统和操作系统驱动程序合作的情况下注册新内存,但它是不可能的。
如果CPU出现故障,HCA可能无法访问内存,因为所有内存访问都通过PCIe根联合体和CPU上的内存控制器。