工人角色去骑自行车......过了一段时间,谁能得到警报?

时间:2013-09-06 17:57:30

标签: azure azure-worker-roles

我部署了一个工作者角色,可以在一段时间内工作正常(几天......),但在某些时候停止或崩溃,然后它根本无法重启并保持“骑自行车......”。唯一的解决方案是重塑角色。

如何设置自动提醒,以便在角色无响应(和骑车......)时收到电子邮件?

由于

2 个答案:

答案 0 :(得分:0)

此类提醒或通知今天无法使用,但正在进行处理。如果这导致服务中断,您可以随时注册外部监控服务,该服务会在您的站点停机时向您发送警报。

但是,我建议解决问题的根本原因,而不仅仅是重新映像以修复症状。我将如何开始:

  1. 您最有可能遇到http://blogs.msdn.com/b/kwill/archive/2012/09/19/role-instance-restarts-due-to-os-upgrades.aspx中描述的问题。特别是,请参阅常见问题下的#1,其中讨论了由于操作系统更新而导致角色重新启动后无法正常重新启动的常见原因。请注意,#1还讨论了如何模拟这些类型的Azure环境问题(即手动从门户网站执行重新启动),以便您可以重现故障并对其进行调试。
  2. 要解决此问题,我建议您阅读http://blogs.msdn.com/b/kwill/archive/2013/08/09/windows-azure-paas-compute-diagnostics-data.aspx的问题排查系列。您特别感兴趣的可能是“故障排除方案2 - 运行良好2周后的角色回收”

答案 1 :(得分:0)

Azure无法通知您此类情况。考虑在WorkerRole的循环周围放置一个try / catch,其中有一个catch可以在出现问题时通过电子邮件发送给你。

或者,如果您愿意使用第三方服务,请考虑AzureWatch(我与该产品有关联)。如果您的实例变为无响应,忙碌或通过其他非就绪状态,它可以提醒您