问题的结构:
4 node cluster
Bolt 2 - parallelism factor is 8, so 2 executers per worker.
由于其中一个执行者的高延迟,我注意到风暴拓扑中滞后超时。
如果您在图片中注意到,只有1名执行者的负载稍高,延迟时间也非常长。 Spout工作得很好! 任何指向可能的问题的指针都会受到赞赏。
注意工人/主管日志中不寻常的观察者。
工作者JVM具有很高的内存,所以这不是问题。
PS:发布时的cpu利用率> 100%累积,而在其他节点上则为~15%。 这已经缩小,因为它不是特定于机器的问题,因为此行为在几个小时的周期内从一个Executer切换到另一个Executer。