我有一台Kubernetes服务器,并且最近遇到了一个主要问题,它在那里停了几个小时。原因是非常欺骗,我将在下面分享答案。
为了给出一些上下文,我可以启动服务器并登录。大约15秒后,一切都会挂起并出现错误,
INFO: task [TASK]:[PID] blocked for more than 120 seconds
。
在此之前,我收到以下错误消息,
IPv6: ADDRCONF(NETDEV_UP): docker0: link is not ready
我修复的方式是我登录并输入,
sudo systemctl disable docker
当我尝试使用sudo systemctl stop docker
时,它花了太长时间并且会挂起,所以我决定要禁用它然后重新启动。
之后的消息,
INFO: task [TASK]:[PID] blocked for more than 120 seconds
不断弹出。这不是一个特定的任务(通常我发现它是task cron:...
)因此我意识到某些东西阻止了我的IO,我需要在它杀死我的会话之前杀死它。
答案 0 :(得分:0)
我发现解决方案是我的备份软件正在运行并且完全破坏了我的磁盘IO。幸运的是,我安装了iotop
,它向我展示了我的硬盘驱动器上有500M / s的读/写功能,这真的是推动它。
所以我做的是我停止了我的备份服务,一切都已整理好了。现在我知道这可能与你的情况不一样,但是,你可以使用相同的方法。