有没有办法我可以定义一个函数来基于kafka connect中的主题消息确定S3路径

时间:2018-10-09 01:37:10

标签: amazon-s3 apache-kafka apache-kafka-connect confluent

这个问题与S3的Kafka有关。

要求:我们感兴趣的kafka主题之一包含一些特定信息,例如时间戳,表等。我们可以使用此数据来确定它将去往哪个S3路径,即{ {1}}

问题:我们正在考虑使用kafka connect,因为没有理由重新发明轮子。但是,我找不到一种方法可以插入s3bucketName/timestamp/table/...来在kafka connect中进行映射(从主题数据到S3路径)(随后是链接https://docs.confluent.io/current/connect/kafka-connect-s3/configuration_options.html)。我想知道kafka connect是否提供此功能,如果没有,请问其他人以前做了吗?

1 个答案:

答案 0 :(得分:0)

TimestampPartitioner的默认行为将写入

s3bucketName/s3Prefix/topicName/timestamp/files.avro

如果不能令人满意,那么Kafka Connect完全是“插件”驱动的,您可以编写自己的插件。例如,没有分区程序会将时间戳记和数据中的特定字段放在一起-您需要分别编写