偶然延迟天蓝云服务的响应

时间:2014-12-23 16:57:38

标签: azure azure-web-roles

我维护着一个天蓝色的云端服务。它设置为基于负载自动缩放。为了监控这项服务的健康状况,我有另一项服务,每隔2分钟拨打一次这项服务。此服务的通常响应时间约为100毫秒。

每周一到两次,我发现服务没有响应。这对我来说并不是一件令人担心的事情 - 因为它很少发生。我仍在试图找出可能导致服务无法响应的原因。我认为问题不在于ping服务 - 我没有看到任何其他服务(不是在azure上,而是在其他服务器上),它有任何问题。

这可能导致这些偶然的延误。任何其他天蓝色服务所有者都会看到这种延迟吗?

1 个答案:

答案 0 :(得分:0)

有类似的问题。但我使用Applications Inside,所以我有一些统计数据。例如,响应时间与SQL azure访问时间和CPU使用率一起增加。根据Applications Inside的平均响应时间约为600毫秒,平均RPS约为0.6。在这些问题中,RPS通常高于平均值 - 高达1.5,但平均响应时间增长到1分钟! (在白天,我的RPS可以增长到3甚至更高,没有任何响应时间增长)。由于我有1分钟的sql连接超时,并且在这段时间内我的SQL天蓝色访问时间有了大幅度的增长,我可以假设问题发生在SQL Azure之外。这也是每天或两天发生一次,最多大约10-15分钟,我的ping服务也总是报告服务没有响应。 所以我的建议在这里 - 安装Application Insights来分析这些响应延迟会发生什么。如果你在这里分享你的结果会很棒。

P.S。我也使用基于负载的自动缩放。虽然它在这些具体情况下并没有真正帮助。

相关问题