为什么我们可以对AWS中的EMR集群使用竞价型实例?

时间:2019-12-04 03:50:28

标签: amazon-web-services amazon-emr

我在AWS实践中遇到了这个问题,并希望将其发布在此处进行进一步讨论:

  

您的公司是   规划使用AWS中可用的EMR服务来运行其   大数据框架,并希望最小化运行EMR的成本   服务。以下哪项可以帮助实现这一目标?

Options:
A.  Running the EMR cluster in a dedicated VPC
B.  Choosing Spot Instances for the underlying nodes
C.  Choosing On-Demand Instances for the underlying nodes
D.  Disable automated backups 

Correct Answer
B. Choosing Spot Instances for the underlying nodes

问题: 引自AWS document的引用:使用竞价型实例时,必须为中断做好准备。

我对EMR服务的理解是,它需要资源来完成作业(服务),如果说mapreduce作业没有足够的资源,则该作业将失败。 竞价型实例,尽管成本很低,但不能保证可用性,AWS明确指出(在同一页面中从此处引用):

  

如果您的最高价格超过指定价格的当前现货价格   实例,并且容量可用,您的请求已满足   立即。

注意:“ 容量可用”,换句话说,如果容量不可用,则您的请求将无法满足。

我认为应为基础节点选择按需实例,获得工作比节省成本更为重要,如果无法完成工作则毫无意义。

1 个答案:

答案 0 :(得分:0)

AWS认证考试不断抛出这类问题。

由于没有提到公司不希望任何中断,因此Spot实例是最小化成本的正确答案。

根据我的经验,与Spot的费用相比,on-demand给予了80%的折扣。