想要清除有关AWS Glue的全景

时间:2019-03-28 19:32:56

标签: amazon-web-services pyspark aws-glue

我想清除有关以下几个方面的关于aws Glue的概况。

  1. AWS Glue如何准备和配置其基础架构?但是它是无服务器的,但是如何管理它呢?

  2. 它如何使用apache spark和hadoop一次解决许多ETL作业,几乎每个地区的数百名AWS Glue客户的作业。

谢谢

1 个答案:

答案 0 :(得分:1)

AWS Glue在下面使用EMR。当新作业开始时,它会产生一个具有所需执行者数量的新群集(取决于配置的DPU)。但是,为了缩短冷启动时间,它们为大多数DPU配备了已配置的EMR集群的缓冲区。为了管理所有这些,他们提供了一组自动化服务,这些服务可以监视每个集群的状态,启动新的集群等。