从AWS控制台手动调整正在运行的群集的大小会在内部使用调用和撤销过程吗?
我们正在研究EMR集群,我们从aws控制台手动调整集群大小,导致缺少/ user / oozie / share / lib / jars。我探讨了这个问题,发现在Hadoop中调试和退役Datanode是调整节点大小和避免集群损坏的最佳方法。 https://acadgild.com/blog/commissioning-and-decommissioning-of-datanode-in-hadoop/ 当我从aws控制台调整集群大小时,如何做到这一点? aws控制台是否在内部维护它?
答案 0 :(得分:0)
是EMR向下缩小,无论是Autoscaling手动还是在终止节点之前调用HDFS / YARN退役过程。这将确保HDFS数据不会丢失并且正在运行的YARN作业不会突然被杀死。 看到: https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-scaledown-behavior.html
对于放大,它只是一个简单的DataNode和NM守护进程启动,具有正确的主要配置来注册它们。