应用错误收集

创建了多少个消费者来读取每个直接流的记录？

时间：2017-06-21 21:11:22

标签： apache-spark apache-kafka spark-streaming

我使用Spark Streaming从Kafka读取数据（使用Kafka direct stream API）。

为流实例化了多少Kafka消费者？卡夫卡消费者的数量是否等于遗嘱执行人的数量？每个执行者是否实例化一个Kafka消费者（具有相同的组ID）？

1 个答案:

答案 0 :(得分：2)

直接接近消费者数量will be exactly the same as the number of Kafka Partitions：

Kafka 0.10的Spark Streaming集成在设计上与0.8 Direct Stream方法类似。它提供简单的并行性，Kafka分区和Spark分区之间的1：1对应关系，以及对偏移和元数据的访问

和单独的消费者is initialized for each partition。