我有一个生产环境,其中包含一簇玻璃鱼(4.1版)和两个节点。每3或4天,门户网站不可用,没有答案。当我们尝试访问URL时,没有任何响应。就像集群不再能够控制节点一样。
一个重要的事实:发生此问题并执行stop cluster命令时,节点的Java进程未完成。它们甚至在stop-cluster命令之后运行。始终有必要通过运行kill -9 ID_PROCESS来手动终止这些进程。
什么可能导致此问题?
另一个事实是日志未显示任何内容。该日志仅在域启动时显示。当应用程序启动时,日志将停止显示,并显示以下错误: stack glassfish node 1