应用错误收集

大约3天前，我开始使用google cloud，所以我是一个新手。我有4个Pod部署到了Google Kubernetes Engine：

**并为我的postgresql数据库运行一个sql实例，因此cloudsql-proxy容器

此设置可以在50％的时间内正常运行，但有时所有吊舱都崩溃或/和重新创建容器。

我试图检查所有相关日志，但是我真的不知道哪些实际上相关。但是我发现有一件事与我的问题有关，我正在运行2个VM实例，其中一个可能是错误的实例：

当我悬停加载旋转时，它会说实例正在验证，并且似乎在80％的情况下处于这种状态，如果实例名称旁边没有黄色警告，说资源未准备好。

这是实例的cpu用法（所有硬件的趋势都相同），我检查了前端和后端容器的日志，这是与CPU删除相对应的最新日志：

2019-03-13 01：45：23.533 CET-服务器就绪

2019-03-13 01：45：33.477 CET-2019/03/13 00:45:33客户端在127.0.0.1:5432上关闭了本地连接

2019-03-13 01：54：07.270 CET-纱线运行v1.10.1

正如您在此处看到的那样，所有吊舱都在重新创建...

我认为这可能是由于故障实例不健康造成的：

对于。，
实例gke-*****-production-default-pool-0de6d459-qlxk 不健康。 。

...运行状况检查正在进行，并且一次又一次重新创建/重新启动该实例。 告诉我我错了。 因此，我如何发现导致该实例不正常的原因？