Heroku应用程序崩溃时不一致:在哪里查看?

时间:2019-07-05 08:32:48

标签: heroku crash

免责声明::请告诉我这个问题是否太广泛了,我将尽力缩小此范围。

我们有一个Heroku应用程序,它正在运行2个Web 1X dynos。该基础架构已经运行了9个月。

但是,在过去的几周中,我们出现了几集,其中应用程序的响应时间猛增了大约一个小时,然后我们又没有采取任何措施就恢复了正常运行。

在下面的图片上,您可以找到昨天下午发生的这些“事件”之一中的Heroku指标摘录。

report1 report2

如您所见,响应时间在增加,最终,几乎所有对服务器的请求都会超时。活动期间,甚至无法加载此应用程序上托管的我们网站的主页。在大多数情况下,我们会获得“应用程序错误” Heroku页面。

我看到的是:

  • 对服务器的请求数量(失败或失败)不是异常高(每10分钟少于1000个)。因此,我认为无法进行DDOS攻击。
  • Heroku Logs所显示的一切都是,失败的请求会收到503(服务不可用)错误,这会让我想到过载。
  • 测功机似乎没有过载。内存使用率低,并且dyno负载合理,没有异常。
  • Heroku如https://status.heroku.com/所述(在上一次事件发生于7月1日的情况下)在崩溃事件中没有报告任何问题。

通过多种方法(从界面,命令行或通过我们的Gitlab存储库触发自动部署)重新启动测功器没有效果。

我不太确定如何解释这些指标,以及确保这种情况不会再次发生的解决方案。 所以我的问题是:我应该去哪里?是否有一些有关如何调查Heroku应用程序崩溃的文档?

0 个答案:

没有答案