端口状态始终关闭,无法打开UMAD端口

时间:2012-09-17 11:07:44

标签: linux suse infiniband

我在下列机器上新安装了ofed-1.5-3:

SUSE Linux Enterprise Server 11(x86_64) 版本= 11 PATCHLEVEL = 1

我们的管理员已在机器上安装了CX354A卡(MCX354A-FCBT)卡。 $ lspci | grep -i mel 04:00.0网络控制器:Mellanox Technologies Device 1003

(问题1:我不知道lspci的输出是否正确,我怀疑 虽然如此,但不知道如何获得正确的输出。)

通过./mlnxofedinstall脚本安装了ofed包之后:

ofed_info的输出|头-1: MLNX_OFED_LINUX-1.5.3-3.1.0(OFED-1.5.3-3.1.0):

安装成功,openibd确实加载了所有必需的 模块/驱动程序。 $ service openibd status

加载HCA驱动程序

配置的IPoIB设备: ib0 ib1

目前有效的IPoIB设备:

加载以下OFED模块:

rdma_ucm   ib_srp   rdma_cm   ib_addr   ib_ipoib   mlx4_core   mlx4_ib   mlx4_en   ib_mthca   ib_uverbs   ib_umad   ib_ucm   ib_sa   ib_cm   ib_mad   ib_core   iw_cxgb3   iw_nes

输出hca_self_test.ofed

----执行适配器设备自检---- 检测到的CA数量................. 1 PCI设备检查.......................通过 内核Arch ............................ x86_64 主机驱动程序版本.................... MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0):2.6.32.12-0.7-默认 主机驱动器RPM检查..................通过 CA#0 VPI上的固件.................. v2.10.700 固件检查CA#0(VPI).......... NA     原因:不需要fw版本 主机驱动程序初始化.............通过 CA端口活动数量.............. 0 CA#0(VPI)上的端口#1的端口状态..... DOWN(InfiniBand) CA#0(VPI)上的端口#2的端口状态..... DOWN(InfiniBand) 错误计数器检查CA#0(VPI)......通过 内核系统日志检查....................通过 CA#0(VPI)上的节点GUID ............... 00:02:c9:03:00:f9:ed:e0 ------------------完成---------------------

问题2:现在当我尝试ibstatus或ibv_devinfo时,我看到端口状态为 PORT_DOWN。虽然我在文档中读到它应该处于INIT状态。我的问题 是如何将其转换为INIT状态的。 $ ibv_devinfo

hca_id:mlx4_0         运输:InfiniBand(0)         fw_ver:2.10.700         node_guid:0002:c903:00f9:ede0         sys_image_guid:0002:c903:00f9:ede3         vendor_id:0x02c9         vendor_part_id:4099         hw_ver:0x0         board_id:MT_1090120019         phys_port_cnt:2                 港口:1                         州:PORT_DOWN(1)                         max_mtu:2048(4)                         active_mtu:2048(4)                         sm_lid:0                         port_lid:0                         port_lmc:0x00                         link_layer:IB

            port:   2
                    state:                  PORT_DOWN (1)
                    max_mtu:                2048 (4)
                    active_mtu:             2048 (4)
                    sm_lid:                 0
                    port_lid:               0
                    port_lmc:               0x00
                    link_layer:             IB

当我尝试按照命令时出错:

$ ibportstate -G 0x0002c90300f9ede0 1查询/启用/禁用 ibwarn:[9318] mad_rpc_open_port:无法打开UMAD端口((null):0) ibportstate:iberror:失败:无法打开'(null)'端口'0'

问题3:我不知道为什么会出现这个错误,或者我如何摆脱它。任何帮助 非常感谢。

如果您需要更多信息,请与我们联系。

由于

1 个答案:

答案 0 :(得分:1)

ibv_devinfo中的端口状态将一直关闭,直到您将此节点连接到另一个节点或infiniband并使用infiniband电缆切换。从模块看起来你已经完成了所有必要的设置,只是缺少另一个要与之交谈的节点。一旦将其连接到另一个节点,您应该能够看到状态已更改为PORT_INIT并且链接速度等已填充。