我在AWS环境中工作,我需要执行以下[编辑]作为日常计划任务[/编辑]:
我查看了AWS Glue,但我认为我无法在其中迈出第一步。您会建议使用哪种工作流程或工具组合?
答案 0 :(得分:1)
boto3
库将这些库上传到S3 COPY
命令将S3中的数据加载到Redshift中(迄今为止最快的方式)答案 1 :(得分:1)
您可以编写Lambda function with scheduled events来抓取API。
与配置EC2实例相比,使用Lambda最有可能更便宜,因为您的工作不耗时且数据量较少。
如果您希望仍然使用EC2实例,您可以将Lambda计划事件用于start and stop the EC2 instance(或者,一旦作业完成,EC2实例本身就可以关闭。)