Apache风暴ui容量指标

时间:2017-03-24 04:31:02

标签: parallel-processing apache-storm

如何计算“容量”?

从他们的文档中

“容量”指标非常有用,它可以告诉您最后10分钟内螺栓执行元组的时间百分比。如果此值接近1,则螺栓处于“容量”状态,并且是拓扑中的瓶颈。容量螺栓的解决方案是增加螺栓的平行度。

我不太明白时间。因此,如果该值为0.75 - 它的真正含义是什么?

1 个答案:

答案 0 :(得分:1)

这是螺栓忙碌与空闲时间的百分比。 0.75意味着25%的时间正在等待处理新数据。

假设您每秒都会收到一个新的输入元组,但是你的螺栓需要0.1秒来处理它,螺栓将在90%的时间内空转,容量将为0.1。

另一个例子:想象一下,你可以实时获得更多可以处理的数据,并且你有两个螺栓,第一个螺栓的任务比第二个螺栓需要更多的时间,因此第一个螺栓是你的瓶颈。第一个螺栓的容量约为1,第二个螺栓的容量将低于1.

在上面的两个示例中,您可以通过查看此数字来确定为每个螺栓设置所需的并行度(或处理能力)。

如果第一个螺栓容量为1而第二个螺栓容量为0.5,则可能需要将第一个螺栓的执行器数量设置为第二个螺栓的两倍。同时(也是最重要的),您必须增加执行程序的数量,直到螺栓容量低于1,因此您确信您的拓扑能够跟上并处理所有正在进入的数据实时。