我们在1个nimbus节点+4个管理节点的集群上使用apache-storm-0.9.6。
在这个周末,名为fetcher-10-1459843589
的拓扑突然停止处理任何消息。它是ACTIVE
,一切似乎都在运行,但没有处理任何数据。
最后,我们手动重新启动了拓扑。新拓扑名为fetcher-12-1460363279
。它运行正常,它处理数据。
问题 - > 我们不明白为什么我们从 fetcher-10 -... 转到 fetcher-12 -... ? 哪里可以是fetcher-11 -...?
实际上我们并不了解很多东西,但我们希望这会对我们有所帮助:)。我们真正想要找到的是,当拓扑为ACTIVE
时,我们为什么会得到这些冻结状态,没有报告的异常,也没有处理数据。
请注意,Storm是在码头工具中启动的。如果您需要更多信息,请告诉我。我会编辑这篇文章。
谢谢
答案 0 :(得分:0)
我想我已经找到了答案。
在群集中可能会运行更多拓扑。
让A
,B
,C
,D
成为在同一群集中运行的4种拓扑。这是我的情况。当您启动拓扑时,他们将为每个拓扑分配连续数字,但每个群集(这是我的错误)。因此,我们从:
A-1-...
B-2-...
C-3-...
D-4-...
如果您重新开始C
,那么您将
C-5...
那么C-4
在哪里?它根本不存在,因为4
已经采用了D
。
因此,跳过n
yo n+2
是正常的。您可能会发现n+1
已分配给其他拓扑。 (q.e.d。)