不健康的工作者角色没有重新启动并等待状态

时间:2013-05-03 08:31:27

标签: azure azure-worker-roles

我有一个worker-role,4个实例,带有外部TCP / IP端点。经过几天没有问题,实例开始死亡,一个接一个。

在24小时内,所有人都处于状态: “等待状态(角色已报告为不健康。)”。

所有这些都发送“Working”verbose到log(来自Run方法),但不接受任何传入连接。怎么会发生这种情况?某些线程未处理的异常?

为什么所有这些都没有重新启动,即使几个小时后所有这些都只是“等待状态”?

1 个答案:

答案 0 :(得分:0)

如果他们无休止地重复启动 - 关闭 - 重启循环,那么一种可能性是你有一个启动任务,它在第一次运行时工作但在后续运行时失败(即,它不是幂等的)。

否则,您的启动过程中可能会出现问题,但如果没有更多信息,很难说。尝试RDP进入机器并查看Windows事件日志以及您能想到的任何其他信息,以获取线索。

您也可以尝试重新映像一个或两个实例,看看是否能解决问题。这至少会告诉您问题是否在基本代码中,或者VM是否进入某种不可恢复的状态。