我有一个4节点,gpfs集群启动并运行,直到上周托管这些RHEL设置的服务器出现故障时,情况还不错,服务器启动后,rhel节点重新启动,其中一个节点&# 39;知识产权改变了,
之后我无法使用节点
像mmlscluster',mmgetstate'这样的简单命令会因此错误而失败:
[root @gpfs3~] #mmlscluster mmlscluster:无法确定本地 节点身份。 mmlscluster:命令失败。检查以前的错误 确定原因的消息。 [root @gpfs3~] #mmstartup mmstartup: 无法确定本地节点标识。 mmstartup:命令 失败。检查以前的错误消息以确定原因。
Mmshutdown失败并出现不同的错误:
[root @ gpfs3~] #mmshutdown mmshutdown:来自的意外错误 getLocalNodeData:未知的environmentType。返回码:1
日志有这个信息:
Mon Feb 15 18:18:34 IST 2016:Node重新启动。开始mmautoload ... mmautoload:无法确定本地节点标识。 2月15日星期一 18:18:34 IST 2016 mmautoload:GPFS正在等待守护进程网络 mmautoload:无法确定本地节点标识。 2月15日星期一 18:19:34 IST 2016 mmautoload:GPFS正在等待守护进程网络 mmautoload:无法确定本地节点标识。 2月15日星期一 18:20:34 IST 2016 mmautoload:GPFS正在等待守护进程网络 mmautoload:无法确定本地节点标识。 2月15日星期一 18:21:35 IST 2016 mmautoload:GPFS正在等待守护进程网络 mmautoload:无法确定本地节点标识。 2月15日星期一 18:22:35 IST 2016 mmautoload:GPFS正在等待守护进程网络 mmautoload:无法确定本地节点标识。 mmautoload: 无法初始化GPFS环境。 mmautoload:纠正 问题并使用mmstartup启动GPFS。
我尝试将IP更改为新的,仍然是同样的错误:
[root @gpfs1~] #mmchnode -N gpfs3 --admin-interface = xx.xx.xx.xx Mon Feb 15 20:00:05 IST 2016: mmchnode:处理节点gpfs3 mmremote:无法确定 本地节点标识。 mmremote:命令失败。检查以前的错误 确定原因的消息。 mmremote:无法确定本地 节点身份。 mmremote:命令失败。检查以前的错误 确定原因的消息。 mmchnode:来自的意外错误 checkExistingClusterNode gpfs3。返回码:0毫秒:命令 失败。检查以前的错误消息以确定原因。
有人可以帮我解决这个问题吗?
答案 0 :(得分:0)
最简单的修复可能是从群集中删除节点(mmdelnode
),然后将其添加回(mmaddnode
)。您可能需要mmdelnode -f
。
如果不能选择删除并添加节点,请尝试给IBM支持人员打电话。