PCI重新扫描会导致infiniband数据包丢失

时间:2016-12-15 14:51:12

标签: linux pci pci-e hotswap infiniband

当我使用echo 1 > /sys/bus/pci/rescan在Linux上触发PCI重新扫描时,我遇到了网络问题。我观察到数据丢失,有时客户端/服务器应用程序或进程变成僵尸进程的死锁。

这发生在由两个Infiniband控制器和一些PCIe设备组成的节点上。当其中一个设备发生故障时,我需要触发PCI重新扫描(为了重新枚举PCIe树并重新列出设备):

  • ditribution: centos 7.2 (7.1同样)
  • 内核: 3.10.0
  • OFED: OFED-3.1-1.0.3 (与3.4相同)
  • 固件: 12.17.1010 (Mellanox MT27700系列[ConnectX-4])
  • grub引导选项: pci = realloc = on

是否有可能重新扫描PCI ,同时存在一些网络活动而不会导致问题?如果没有,是否有更有选择性的方法来重新启动PCIe总线的一部分?

0 个答案:

没有答案