我有以下代码,使用Kafka连接器为Spark创建直接流。但是我想处理一种情况,我可以决定这种流式传输需要在有条件的基础上暂停一段时间,有没有办法实现这一目标? 假设我的Kafka正在进行一些维护,所以在上午10点到12点之间停止处理,然后在上次偏移的12点再次接收,我该怎么做?
final JavaInputDStream<KafkaMessage> msgRecords = KafkaUtils.createDirectStream(
jssc, String.class, String.class, StringDecoder.class, StringDecoder.class,
KafkaMessage.class, kafkaParams, topicsPartitions,
message -> {
return KafkaMessage.builder()
.
.build();
}
);
答案 0 :(得分:0)
有两种方法: