我有一个三部分拓扑结构,有一些严重的延迟问题,但我无法弄清楚在哪里。
kafka - > db lookup - >写信给cassandra
风暴UI中的数字如下所示:
(我看到螺栓的运行速度大于1.0)
如果两个螺栓的过程延迟为~65ms,为什么'完整潜伏期'> 400秒? “失败的”元组来自超时,我怀疑延迟值正在稳步增加。
元组通过 shuffleGrouping 连接。
Cassandra生活在AWS上,因此可能存在网络限制。
风暴群集有3台机器。拓扑中有3名工作人员。
答案 0 :(得分:2)
您的拓扑有几个问题:
答案 1 :(得分:0)
FWIW - TOPOLOGY_MAX_SPOUT_PENDING 的默认值似乎不受限制。我添加了对stormConfig.put(Config.TOPOLOGY_MAX_SPOUT_PENDING, 500);
的调用,似乎(到目前为止)问题已经缓解。可能是“雷鸣般的群体”问题?
将TOPOLOGY_MAX_SPOUT_PENDING设置为500后: