我在AWS实践中遇到了这个问题,并希望将其发布在此处进行进一步讨论:
您的公司是 规划使用AWS中可用的EMR服务来运行其 大数据框架,并希望最小化运行EMR的成本 服务。以下哪项可以帮助实现这一目标?
Options:
A. Running the EMR cluster in a dedicated VPC
B. Choosing Spot Instances for the underlying nodes
C. Choosing On-Demand Instances for the underlying nodes
D. Disable automated backups
Correct Answer
B. Choosing Spot Instances for the underlying nodes
问题: 引自AWS document的引用:使用竞价型实例时,必须为中断做好准备。
我对EMR服务的理解是,它需要资源来完成作业(服务),如果说mapreduce作业没有足够的资源,则该作业将失败。 竞价型实例,尽管成本很低,但不能保证可用性,AWS明确指出(在同一页面中从此处引用):
如果您的最高价格超过指定价格的当前现货价格 实例,并且容量可用,您的请求已满足 立即。
注意:“ 容量可用”,换句话说,如果容量不可用,则您的请求将无法满足。
我认为应为基础节点选择按需实例,获得工作比节省成本更为重要,如果无法完成工作则毫无意义。
答案 0 :(得分:0)
AWS认证考试不断抛出这类问题。
由于没有提到公司不希望任何中断,因此Spot
实例是最小化成本的正确答案。
根据我的经验,与Spot
的费用相比,on-demand
给予了80%的折扣。