我想清除有关以下几个方面的关于aws Glue的概况。
AWS Glue如何准备和配置其基础架构?但是它是无服务器的,但是如何管理它呢?
它如何使用apache spark和hadoop一次解决许多ETL作业,几乎每个地区的数百名AWS Glue客户的作业。
谢谢
答案 0 :(得分:1)
AWS Glue在下面使用EMR。当新作业开始时,它会产生一个具有所需执行者数量的新群集(取决于配置的DPU)。但是,为了缩短冷启动时间,它们为大多数DPU配备了已配置的EMR集群的缓冲区。为了管理所有这些,他们提供了一组自动化服务,这些服务可以监视每个集群的状态,启动新的集群等。