如果在一个主题上我收到某种格式的消息,该消息表示相同结构的列表(例如JSON列表或protobuf中的重复字段),可以将Kafka Connect配置为将列表中的每个条目写为单独的行(例如在HDFS的实木复合地板文件中还是在SQL数据库中?是否可以仅使用捆绑的转换器/连接器?
即我可以使用每条Kafka邮件代表数千条记录,而不是发送数千条单独的邮件吗?
使用Kafka Connect实现这一目标的简单方法是什么?
答案 0 :(得分:0)
捆绑的消息转换仅能够进行一对一的消息操作。因此,如果您想让Connect将其写成单独的记录,则必须以某种方式(直接或通过流处理应用程序)显式生成那些扁平化列表。
或者,如果适用,您也可以使用Hive或Spark扩展该列表,以供以后处理。