风暴如何利用动物园管理员的弹性?

时间:2014-02-02 07:30:09

标签: apache-zookeeper apache-storm

来自Storm的描述,它基于Zookeeper,每当一个工作节点死亡时,它就可以恢复并从zookeeper中获取它的状态。

有人知道这是怎么做的吗?具体

  1. 失败的工作节点如何恢复?
  2. zookeeper如何保持其状态。 AFAIK,每个区域只能存储少量数据。

1 个答案:

答案 0 :(得分:2)

您在谈论工人或主管吗?每个风暴工作者节点都运行一个风暴“主管”守护程序来管理工作进程。

  1. 您需要设置监控(类似daemontools或supervisord,与风暴监督员无关)来监控和重新启动nimbus和supervisor守护进程,以防它们发生异常。灵气和监督都是快速失败和无状态的。 Zookepeer用于在nimbus和supervisor之间进行协调,同时保存状态信息,这些信息位于zookeeper或磁盘上,以免丢失状态信息。
  2. 状态数据不大,Zookeeper也应该受到监督。
  3. 检查this以获取更多容错详情。