标签: amazon-s3 streaming apache-flink parquet
我正在开发一个Flink流应用程序,该应用程序使用来自kafaka / kinesis的消息,并且在处理它们之后必须每隔5分钟将输出以拼花格式写入S3中。
请提出一种实现此目标的方法,因为我面临很多问题。
当前,我正在使用Flink 1.4.2,因为我正在考虑将其部署在AWS EMR 5.15集群上。
方法已尝试-我使用了模块“ flink-s3-fs-hadoop”,镶木地板api和flink“ BucketingSink”