我看到Kafka Connect可以用Avro或JSON格式写入S3。但是没有Parquet的支持。这有多难加?
答案 0 :(得分:4)
从Confluent 5.4.0开始,官方将Parquet输出到S3。
答案 1 :(得分:2)
Qubole连接器支持书写镶木地板 - https://github.com/qubole/streamx
答案 2 :(得分:1)
尝试secor
:
https://github.com/pinterest/secor
可以与AWS S3,谷歌云,Azure的Blob存储等配合使用。
请注意,您选择的解决方案必须具有以下关键功能: 确保每个消息只写一次,负载分配,容错,监视,分区数据等。
Secor
拥有全部,并且如上所述,可以轻松地与其他“ s3”样式的服务一起使用。