我正在为我的风暴拓扑应用并行性。我设置了worker node = 1。
实施例#1 我将特定组件的任务编号和执行者编号设置为" 2"。
示例#2:没有任务<执行人没有 我将任务数量设置为" 1"和执行人的数量为" 2"对于特定组件。
示例#3:没有任务>执行人没有 我将任务数量设置为" 5"并且执行人的数量为" 1"对于特定组件。
我不知道上面哪个例子会导致拓扑的最佳并行性,并建议哪一个带来Storm Parallelism的好处?请帮我理解这一点。
答案 0 :(得分:1)
你读过这篇文章了吗? https://storm.apache.org/documentation/Understanding-the-parallelism-of-a-Storm-topology.html
为了获得良好的性能,您应该将执行程序的数量设置为可用核心数(每个执行程序在自己的线程中运行)。如果要在运行时更改并行性,则使用比执行程序更多的任务是有益的。
您的“示例#2”无效配置:#tasks> = #executors必须始终为true(否则,会有线程没有工作)。