我们只是在GCP中配置错误报告,该报告显示了一段时间内错误的直方图(按类型分组)。但是我认为这些数据没有那么有用。我的意思是,为了争辩,对于100个请求有100个错误意味着我们的服务已损坏。但100万个请求的100个错误就可以了。
这就是为什么我在考虑使用P99 / P95 / P90方法添加警报/监视的原因。我还要查看是否可以根据#个数据点配置警报,即,如果P90上的错误计数> 5达10分钟,则发出警报。
这是可以在GCP中完成的事情吗?我相信这在AWS中是可行的,但在GCP中是不可能的。