我正在尝试使用NiFi的PutCassandraRecord将数据输入到由3个节点组成的Cassandra群集中(前提是所有3个节点的地址都为PutCassandraRecord)。我获得的吞吐量不足以满足我的工作量,因此我使用3种不同的PutCassandraRecord处理器进行了测试,并为每个处理器提供1个节点地址。我能够通过这条路线获得更高的吞吐量。
我的问题是,我可以将传入流文件的数量平均分配给3个或更多不同的处理器吗?更具体地说,我正在使用ListenHTTP侦听传入的数据,并且希望将传入的数据平均分配给3个不同的PutCassandraRecord处理器
我正在运行NiFi 1.9.2
答案 0 :(得分:2)
您可以将DistributeLoad处理器用于循环分发。
此外,您可以尝试使用单个PutCassandraRecord处理器,但是将处理器的并发任务从1增加到3。这应该类似于拥有3个单独的处理器,但是我对Cassandra一无所知,所以我不知道不知道指定所有节点与仅指定一个节点之间的区别。