我可以保持已启动的EMR群集运行并继续向其提交新作业,直到我完成(比如几天后),然后关闭群集或者我必须在EC2中使用我自己的群集来执行此操作?
答案 0 :(得分:1)
是
特别是,我使用CLI客户端。以下是我的一个脚本的片段:
JOBFLOW_ID=`elastic-mapreduce --create --alive --name cluster --num-instances $
COUNT --hadoop-version 0.20.205 --ami-version 2.0 --plain-output --debug --log-uri $LOG_
URI`
echo "Launched --jobflow $JOBFLOW_ID"
elastic-mapreduce -j $JOBFLOW_ID --ssh
您可以使用-j -term终止,使用--ssh向主服务器发出cli命令。 DevGuide中甚至还有一个页面(您应该真正阅读它)about adding more than 256 steps(在已经启动的实例上完成,请注意),所以它真的不是一个大问题。