AWS EMR集群未启动

时间:2015-11-17 19:53:27

标签: amazon-web-services emr amazon-iam

我正在使用AWS EMR集群 用于对评论进行情绪分析。我的EMR集群说状态是 "启动和#34;一起几个小时。

我已完成以下步骤:

  1. 创建了IAM用户并分配了AdministrativeAccess策略组。
  2. 创建用于保存输入,日志和输出的S3存储桶
  3. 使用以下命令在AWS CLI中创建集群:

    aws emr create-cluster --release-label emr-4.1.0 --service-role="EMR_DefaultRole" --ec2-attributes AvailabilityZone=us-west-1a,InstanceProfile="EMR_EC2_DefaultRole" --instance-groups InstanceGroupType=MASTER,InstanceCount=1,InstanceType=m1.medium InstanceGroupType=CORE,InstanceCount=2,InstanceType=m1.medium --name "Yelp Review Sentiment Analysis Cluster" --log-uri s3://mybucket/logs/ --enable-debugging --tags Name=emr --bootstrap-actions Path=s3://mybucket/bootstrap-mrjob.sh,Name="Setup mrjob / text analytics"

  4. 我的群集已创建但状态未发生变化。有没有 我错过了哪些步骤?

2 个答案:

答案 0 :(得分:0)

您可能会在群集信息页面的“事件”标签中看到提示。此外值得调查日志(您希望使用--log-uri激活),它们包含节点启动(在./node中)的详细信息以及基于每个节点的引导操作(在./steps中)

答案 1 :(得分:-1)

我按照以下步骤创建了AWS EMR集群:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/EMR_SetUp_KeyPair.html

检查一下。它对我有用。一旦群集的状态从“STARTING”变为“WAITING”,您就可以ssh到群集的主节点并执行您的活动。