Azure会重新启动/重新映像/(两者)我的实例,如果它没有响应?

时间:2014-06-24 11:24:56

标签: azure azure-appfabric

我有一个Azure webrole项目,涉及在实例上安装第三方软件的长期启动任务; 偶尔,我见过没有响应的实例,所以我正在实施一个探测器,让负载均衡器注意到这一点而不是将流量引导到坏的实例。 这当然是不够的 - 我想要的是Azure(Fabric?)然后重启实例,如果这没有帮助(也就是说,让实例正确回复探测) - 重新映像实例。 这是行为,如果是这样,那记录在哪里?我搜索了很长一段时间,但没有找到任何有用的东西。

由于

2 个答案:

答案 0 :(得分:0)

使用管理API,您应该能够从外部监控您的角色实例。然后,如果你需要很长时间,你应该能够force it to be re-imaged

答案 1 :(得分:0)

http://blogs.msdn.com/b/kwill/archive/2013/02/28/heartbeats-recovery-and-the-load-balancer.aspx描述了角色实例的运行状况,Azure为恢复所做的工作以及如何使用负载均衡器探针。

当您说您的实例没有响应时,这是否意味着该实例在门户网站中显示为Busy(或者除Ready之外的其他内容),或者只是IIS不响应请求?如果前者(实例显示Busy)则您不需要负载均衡器探测器,因为Azure将自动从旋转中删除该实例。如果后者(IIS没有响应),那么您可以在Web代码中实现一个StatusCheck事件,这样如果w3wp本身出现问题,那么实例将被结构取消轮换,但是如果w3wp本身是健康的,那么只是没有响应的请求,那么您将需要负载平衡器探测器。

拥有良好的监控和恢复解决方案非常有价值,但我建议您不要重新启动实例来缓解w3wp问题,而应该调查导致实例无法响应的根本原因。修复问题的根源而不是应用创可贴:)。 http://blogs.msdn.com/b/kwill/archive/2013/02/28/heartbeats-recovery-and-the-load-balancer.aspx上的博客文章,特别是故障排除方案5,可能是开始调查的好地方。

相关问题