Rocks簇头节点DNS失败。计算节点无法解析主机名

时间:2017-10-28 16:20:41

标签: dns centos6 rocks

我的任务是维护Rocks(基于Centos 6.2)群集,其中头节点配置有到公共网络的静态IP,并充当内部专用网络上的计算节点的NAT路由器。节点通过标准以太网和QDR Infiniband连接到头节点。

最近,计算节点无法访问外部数据源以开始计算,因为DNS查找失败,因为他们使用wget来下载公开可用的数据集。所有计算节点都在/etc/resolv.conf中配置了头节点的IP,并且我检查了头节点上的iptables防火墙,但没有任何改变。 SSH在所有节点和头节点之间工作。当我使用某些数据源的IP地址进行手动启动的传输时,数据会再次流动,但某些应用程序无法使用IP来获取数据。我尝试重新启动命名和iptables防火墙,到目前为止还没有修复它。系统日志(dmesg,/ var / log / messages)显示没有突然的故障或错误消息,我没有进行最近的配置更改,并且在大约2个晚前之前一切都运行良好。头节点可以很好地访问和解析名称,它只是NAT头节点后面不起作用的计算节点。

我仍然不熟悉岩石的所有工作方式,我不确定是否有一些特殊的岩石命令,我忽略了让它重新开始工作。为了让DNS解析再次运行,我可能会缺少什么?

提前致谢!

更新:DNS在计算节点和头节点之间内部工作(例如,计算-10-10从所有其他节点解析为该节点的IP地址),因此头节点正确地充当群集DNS。对于所有计算节点,对本地区域之外的域的请求仍然失败(例如nslookup google.com失败)。

1 个答案:

答案 0 :(得分:0)

根本原因是上游DNS服务器失败。将/etc/named.conf转发器选项重新配置到其他服务器,所有计算节点都可以再次访问外部资源。