从Kafka Consumer中读取数据后,如何将数据存储到特定目录中?

时间:2019-03-06 16:14:33

标签: apache-kafka kafka-consumer-api apache-kafka-connect

我有一个Kafka主题,我需要使用使用者从中读取JSON数据,但是基于数据中的特定标记,我需要将其存储在驱动器的不同目录中。

我该如何实现?可以在存储之前直接解析数据吗?

1 个答案:

答案 0 :(得分:0)

不清楚这些目录将在哪里,但是您可以尝试将{{1}(与适用于HDFS兼容的文件系统,包括本地磁盘)一起使用HDFS Kafka Connect }以指定FieldPartitioner

格式将Kafka记录中的哪些字段设置为目录

要写入本地磁盘,请设置/topic-dir/topic-name/field1=value/field2=value

否则,Spark,Flink,常规Kafka使用者等,您可以使用该数据并自行构建目录。

  

在存储之前可以直接解析数据吗?

取决于您如何使用数据...