我使用Spark Streaming从Kafka读取数据(使用Kafka direct stream API)。
为流实例化了多少Kafka消费者?卡夫卡消费者的数量是否等于遗嘱执行人的数量?每个执行者是否实例化一个Kafka消费者(具有相同的组ID)?
答案 0 :(得分:2)
直接接近消费者数量will be exactly the same as the number of Kafka Partitions:
Kafka 0.10的Spark Streaming集成在设计上与0.8 Direct Stream方法类似。它提供简单的并行性,Kafka分区和Spark分区之间的1:1对应关系,以及对偏移和元数据的访问