在AWS EC2上自动调度正在运行的Hadoop集群设置

时间:2016-09-16 08:53:21

标签: amazon-web-services amazon-ec2 emr amazon-emr autoscaling

我的目标是了解如何在AWS EC2上自动扩展Hadoop集群。 我正在从弹性扩展角度探索AWS产品,以便在EC2上使用Hadoop作为服务(EMR)和Hadoop。

对于EMR ,我使用CloudWatch收集了该信息,可以监控性能指标,并在用户达到设定的阈值后收到警报,此后可以根据其利用率扩大或缩小群集州。 这种方法需要一些自定义实现来自动执行这些步骤。(如果我在这里缺少任何内容,请纠正我)

对于EC2上的Hadoop ,我遇到了自动扩展选项,可以根据配置的扩展策略添加或删除实例。 但我不清楚新添加的节点如何自动引导到集群? YARN如何知道它可以在这个新添加的节点上生成一个新容器? 自动缩放是否也适用于主从式设置或仅限于Web应用程序?

有Qubole'提供在AWS上管理Hadoop的服务......是否应该用于自动管理群集扩展?

0 个答案:

没有答案