应用错误收集

在一批S3事件上触发了AWS Glue ETL作业

时间：2019-04-15 22:22:16

标签： amazon-web-services bigdata etl aws-glue

我有一个S3存储桶，该存储桶中放有许多文件（每分钟1000条记录）。我想对这些丢弃的文件批次触发Glue ETL作业。

我研究过使用Firehose汇总事件的批次，但这需要大量的链接资源。就像S3-> Lambda-> Firehose-> ...

批量处理数据的最佳方法是什么？

1 个答案:

答案 0 :(得分：0)

您可以使用AWS Glue作业触发器，该触发器可让您按计划的时间间隔运行粘合作业，而不是作为S3事件触发器？

您正在处理流数据吗？信息有限，看不到Firehose的用例/目的。