GPFS:mmremote:无法确定本地节点标识

时间:2016-02-15 14:48:47

标签: linux cluster-computing distributed distributed-system

我有一个4节点,gpfs集群启动并运行,直到上周托管这些RHEL设置的服务器出现故障时,情况还不错,服务器启动后,rhel节点重新启动,其中一个节点&# 39;知识产权改变了,

之后我无法使用节点

像mmlscluster',mmgetstate'这样的简单命令会因此错误而失败:

  

[root @gpfs3~] #mmlscluster mmlscluster:无法确定本地   节点身份。 mmlscluster:命令失败。检查以前的错误   确定原因的消息。 [root @gpfs3~] #mmstartup mmstartup:   无法确定本地节点标识。 mmstartup:命令   失败。检查以前的错误消息以确定原因。

Mmshutdown失败并出现不同的错误:

  

[root @ gpfs​​3~] #mmshutdown mmshutdown:来自的意外错误   getLocalNodeData:未知的environmentType。返回码:1

日志有这个信息:

  

Mon Feb 15 18:18:34 IST 2016:Node重新启动。开始mmautoload ...   mmautoload:无法确定本地节点标识。 2月15日星期一   18:18:34 IST 2016 mmautoload:GPFS正在等待守护进程网络   mmautoload:无法确定本地节点标识。 2月15日星期一   18:19:34 IST 2016 mmautoload:GPFS正在等待守护进程网络   mmautoload:无法确定本地节点标识。 2月15日星期一   18:20:34 IST 2016 mmautoload:GPFS正在等待守护进程网络   mmautoload:无法确定本地节点标识。 2月15日星期一   18:21:35 IST 2016 mmautoload:GPFS正在等待守护进程网络   mmautoload:无法确定本地节点标识。 2月15日星期一   18:22:35 IST 2016 mmautoload:GPFS正在等待守护进程网络   mmautoload:无法确定本地节点标识。 mmautoload:   无法初始化GPFS环境。 mmautoload:纠正   问题并使用mmstartup启动GPFS。

我尝试将IP更改为新的,仍然是同样的错误:

  

[root @gpfs1~] #mmchnode -N gpfs​​3 --admin-interface = xx.xx.xx.xx Mon Feb 15 20:00:05 IST 2016:   mmchnode:处理节点gpfs3 mmremote:无法确定   本地节点标识。 mmremote:命令失败。检查以前的错误   确定原因的消息。 mmremote:无法确定本地   节点身份。 mmremote:命令失败。检查以前的错误   确定原因的消息。 mmchnode:来自的意外错误   checkExistingClusterNode gpfs​​3。返回码:0毫秒:命令   失败。检查以前的错误消息以确定原因。

有人可以帮我解决这个问题吗?

1 个答案:

答案 0 :(得分:0)

最简单的修复可能是从群集中删除节点(mmdelnode),然后将其添加回(mmaddnode)。您可能需要mmdelnode -f

如果不能选择删除并添加节点,请尝试给IBM支持人员打电话。