我们正在设置对各种GKE对象(如Pod,服务,持久存储,Kafka,Redis,cronjob等的自定义参数)的监控
我们能够使用uptime checks来监视全局公开的端点,例如入口和https端点。但是,由于大多数服务没有全局公开,因此我们如何监视clusterIP,nodeport或负载均衡器等服务。
我的问题:
1)是否有必要监视所有服务,例如clusterIP,nodeport或负载均衡器?
2)如果是,您能建议参考文章或相关步骤吗?
注意:集群已启用ISTIO和Google工作负载身份。
答案 0 :(得分:1)
您可以根据需要配置监视。
您可以将Grafana与alert manager结合使用,以松弛状态发布消息。
Uptime robot通过呼叫通知。
Google uptime check通过电子邮件通知。
除非影响和破坏业务逻辑,否则不必检查所有端点。
编辑:1
Statuscake 也是一种不错的选择。