我正在尝试编写一个基于python的工具,以找出导致以下给出的主要kubernetes对象崩溃/不工作/不响应的可能原因。
etcd
Kubernetes master
Kube-api server
Kube controller-manager
Kube-proxy
kubelet
kube-scheduler
例如,如果不满足法定人数,etcd将不会运行。如何解决此问题将是检查正在运行的满足法定人数的etcd节点最少。
这只是我想的一个例子。
我找到了此文档,但不符合我的期望(意味着没有简单的答案)
https://kubernetes.io/docs/tasks/debug-application-cluster/debug-application-introspection/
您能否为每个组件至少提供5种可能的故障原因以及如何对其进行调试?