我使用KafkaSpout
来读取/流式传输压缩字节[]的消息。螺栓很简单:解压缩消息 - >写信给卡桑德拉。我想知道要使用哪种流分组。
样本似乎主要使用 Shuffle分组。在测试中,我一直在使用所有分组(想象我希望所有消息都通过一个螺栓),但我看到关于&#34的注释;小心使用此分组&# 34 ;.
关于如何处理的建议?
答案 0 :(得分:1)
随机分组对于您的用例就足够了,它可以跨下游螺栓分配工作负载。
很少需要进行所有分组,并且可能导致所有下游螺栓中的重复处理。
参考: https://storm.apache.org/documentation/Concepts.html#stream-groupings