我们的环境中存在一个奇怪的NFS问题。我们正在运行Sun Grid Engine群集,并将Master节点作为VM在ESXI中运行。所有其他客户端节点都是运行在SLES11上的物理Linux服务器。有一个共享将从主节点共享,并且所有客户端都可以通过nfs访问。
最近,我们注意到机器和主节点之间间歇性地发生了NFS断开连接,因此共享断开连接了一段时间,这将导致客户端节点中的Grid Engine服务处于脱机状态。
我们检查了服务器和客户端中的日志,但是无法获得有关此断开连接的任何线索。但是,当我们在服务器上运行nfsstats时,我们得到了一些信息。
nfsstat -sr
服务器rpc统计信息: 调用badcalls badclnt badauth xdrcall 2653547712 59839741 214 59839527 0
我还在服务器上运行tcpdump来监视NFS流量,当断开连接时我们遇到了一些错误
“认证伪造的凭据(封条损坏)”
您是否遇到过此类nfs问题。请为上述问题提供帮助并提供一些建议。