如何找到导致GKE错误的Pod

时间:2020-06-02 22:13:15

标签: kubernetes google-kubernetes-engine google-cloud-endpoints

如果我在GCP日志中查看自己的日志,例如,我看到有一个给出500的请求

  log_message: "Method: some_cloud_goo.Endpoint failed: INTERNAL_SERVER_ERROR"   

我想快速转到该吊舱并在其上做一个kubectl logs。但是我没有找到一种方法。

我对k8s和GKE还是陌生的,有什么方法可以追溯处理该请求的Pod?

2 个答案:

答案 0 :(得分:1)

您可以在每个节点上运行命令“ kubectl get pods”以检查所有Pod的状态,并可以通过运行有关错误的详细描述“ kubectl describe pod pod-name”来找出原因

答案 1 :(得分:1)

如@Neelam答案中所述,您可以使用命令kubectl get pods -A获取吊舱名称,然后登录到所有吊舱中以查找错误。

或者,您也可以部署自定义监控系统,例如Elastic GKE Logging,可在GCP github Click-to-deploy中使用。

只需点击几下,即可查看here从MarketPlace安装。

它是拥有完整监视系统的免费替代方案,部署后您可以在Kibana仪表板中过滤日志。