我有一个队列包含不同计数的消息&我有脚本来读取队列并处理消息。我的问题是:一些队列的消息数量非常大,而且它超过平时。因此,为了改进处理,我想要处理所有具有更多计数的队列。如果队列具有线性差异(例如:1000,1200,1300,1800,1900),我想处理完整队列。如果假设计数类似(1000,1200,1300,1800,1900,4000,4500,4900,5200) - 这里4000+是非常大的队列所以我想只采取这些队列。
我希望一些数学计算标准偏差等会有所帮助,但我不知道如何处理它。
答案 0 :(得分:0)
我会这样开始:
答案 1 :(得分:0)
“大”的定义可能不同。如果您知道他们的号码(例如,只有两个组),只需选择适当数量的最大跳跃(比组数少1)。或者,你可以采取一些百分比的大跳跃或分析平均值和变化来选择一些阈值。