Question

我们在1个nimbus节点+4个管理节点的集群上使用apache-storm-0.9.6。

在这个周末，名为fetcher-10-1459843589的拓扑突然停止处理任何消息。它是ACTIVE，一切似乎都在运行，但没有处理任何数据。

最后，我们手动重新启动了拓扑。新拓扑名为fetcher-12-1460363279。它运行正常，它处理数据。

问题 - ＆gt; 我们不明白为什么我们从 fetcher-10 -... 转到 fetcher-12 -... ？ 哪里可以是fetcher-11 -...？

实际上我们并不了解很多东西，但我们希望这会对我们有所帮助:)。我们真正想要找到的是，当拓扑为ACTIVE时，我们为什么会得到这些冻结状态，没有报告的异常，也没有处理数据。

请注意，Storm是在码头工具中启动的。如果您需要更多信息，请告诉我。我会编辑这篇文章。

谢谢

Answer 1

我想我已经找到了答案。

在群集中可能会运行更多拓扑。

让A，B，C，D成为在同一群集中运行的4种拓扑。这是我的情况。当您启动拓扑时，他们将为每个拓扑分配连续数字，但每个群集（这是我的错误）。因此，我们从：

开始

A-1-...
B-2-...
C-3-...
D-4-...

如果您重新开始C，那么您将

C-5...

那么C-4在哪里？它根本不存在，因为4已经采用了D。

因此，跳过n yo n+2是正常的。您可能会发现n+1已分配给其他拓扑。（q.e.d。）