如果在生产系统上使用,k8s相关服务可能会在某个时间停机。是否提供了可以监视和重新启动服务的脚本,或者我需要开发脚本并将它们添加到crontab。
答案 0 :(得分:1)
我猜你的意思是调度程序,apiserver等等。如果是这样,它们已经被在该节点上运行的kubelet监视。 Kubelet本身由保姆(您的初始系统 - 例如暴发户,系统等)监控。根据您的群集配置方式,这些kube-daemon的清单文件可能位于/ etc / kubernetes / manifest下,这些将进行运行状况检查。
答案 1 :(得分:0)
是的..如何关于仪表板(web ui)和kube-dns ..最近我们部署了一个新集群,kube-dns无法正常工作,直到用户报告才意识到。寻找一种自动化测试/实用程序,它可以验证在新的集群部署后正常运行的所有kubernetes所需服务。查看prometheus,它有助于持续监控,但可能对新的集群设置验证没有帮助。