标签: apache-spark apache-kafka spark-streaming
如何使用Spark Streaming for Java API实现以下功能?
我很新兴引发流式传输api,我不知道如何让火花流式上下文停止等待更多的消息来及未来的数据。
答案 0 :(得分:0)
然后您应该使用KafkaUtils.createRDD:
使用每个主题和分区的偏移范围从Kafka创建RDD。这允许您指定要连接的Kafka领导者(以优化提取)并访问消息以及元数据。
这将根据offsetRanges提取所有记录。
offsetRanges