在Kafka Connect中通过一条消息编写多个条目

时间:2019-07-08 16:43:16

标签: hadoop apache-kafka hdfs apache-kafka-connect

如果在一个主题上我收到某种格式的消息,该消息表示相同结构的列表(例如JSON列表或protobuf中的重复字段),可以将Kafka Connect配置为将列表中的每个条目写为单独的行(例如在HDFS的实木复合地板文件中还是在SQL数据库中?是否可以仅使用捆绑的转换器/连接器?

即我可以使用每条Kafka邮件代表数千条记录,而不是发送数千条单独的邮件吗?

使用Kafka Connect实现这一目标的简单方法是什么?

1 个答案:

答案 0 :(得分:0)

捆绑的消息转换仅能够进行一对一的消息操作。因此,如果您想让Connect将其写成单独的记录,则必须以某种方式(直接或通过流处理应用程序)显式生成那些扁平化列表。

或者,如果适用,您也可以使用Hive或Spark扩展该列表,以供以后处理。