我目前正在使用Confluent HDFS Sink Connector(v4.0.0)来取代Camus。我们正在处理敏感数据,因此我们需要在切换到连接器时保持偏移的一致性。
转换计划:
- 我们创建了hdfs sink连接器并订阅了一个写入临时hdfs文件的主题。这将创建名为 connect -
的使用者组
- 使用DELETE请求停止了连接器。
- 使用 / usr / bin / kafka-consumer-groups 脚本,我可以将连接器使用者组kafka主题分区的当前偏移设置为所需的值(即最后一次偏移Camus写了+ 1)。
- 当我重新启动hdfs接收器连接器时,它会继续读取上次提交的连接器偏移量并忽略设置值。我期待hdfs文件名如下:
hdfs_kafka_topic_name + kafkapartition +的 Camus_offset + Camus_offset_plus_flush_size.format
醇>
我对融合连接器行为的期望是否正确?