我正在使用AWS EMR集群 用于对评论进行情绪分析。我的EMR集群说状态是 "启动和#34;一起几个小时。
我已完成以下步骤:
使用以下命令在AWS CLI中创建集群:
aws emr create-cluster --release-label emr-4.1.0 --service-role="EMR_DefaultRole" --ec2-attributes AvailabilityZone=us-west-1a,InstanceProfile="EMR_EC2_DefaultRole" --instance-groups InstanceGroupType=MASTER,InstanceCount=1,InstanceType=m1.medium InstanceGroupType=CORE,InstanceCount=2,InstanceType=m1.medium --name "Yelp Review Sentiment Analysis Cluster" --log-uri s3://mybucket/logs/ --enable-debugging --tags Name=emr --bootstrap-actions Path=s3://mybucket/bootstrap-mrjob.sh,Name="Setup mrjob / text analytics"
我的群集已创建但状态未发生变化。有没有 我错过了哪些步骤?
答案 0 :(得分:0)
您可能会在群集信息页面的“事件”标签中看到提示。此外值得调查日志(您希望使用--log-uri激活),它们包含节点启动(在./node中)的详细信息以及基于每个节点的引导操作(在./steps中)
答案 1 :(得分:-1)
我按照以下步骤创建了AWS EMR集群:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/EMR_SetUp_KeyPair.html
检查一下。它对我有用。一旦群集的状态从“STARTING”变为“WAITING”,您就可以ssh到群集的主节点并执行您的活动。